位置: IT常识 - 正文

特征融合的分类和方法(特征融合add)

编辑:rootadmin
特征融合的分类和方法

推荐整理分享特征融合的分类和方法(特征融合add),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:什么叫特征融合,特征融合的分类包括,特征融合的分类包括,特征融合的优点,特征融合的分类有哪些,特征融合的分类有哪些,特征融合的分类方法,特征融合的分类包括,内容如对您有帮助,希望把文章链接给更多的朋友!

1、特征融合的定义

特征融合方法是模式识别领域的一种重要的方法,计算机视觉领域的图像识别问题作为一种特殊的模式分类问题,仍然存在很多的挑战,特征融合方法能够综合利用多种图像特征,实现多特征的优势互补,获得更加鲁棒和准确性的识别结果。

2、特征融合的分类

按照融合和预测的先后顺序,分类为早融合和晚融合(Early fusion and Late fusion)

早融合(Early fusion):就是在特征上进行融合,进行不同特征的连接,输入到一个模型中进行训练。(先融合多层的特征,然后在融合后的特征上训练预测器,只有在完全融合之后,才进行检测。)这类方法也被称为skip connection,即采用concat、add操作。这一思路的代表是Inside-Outside Net (ION)和HyperNet.

两个经典的特征融合的方法:

(1)concat:系列特征融合,直接将连个特征进行连接。两个输入特征x和y的维数若为p和q,输出特征z的维数为p+q。

(2)add:并行策略,将这两个特征向量组合成复合向量,对于输入特征x和y,z=x+iy,其中i是虚数单位。

晚融合(Late fusion):指的是在预测分数上进行融合,做法就是训练多个模型,每个模型都会有一个预测分数,我们对所有模型的结果进行融合,得到最后的预测结果。(通过结合不同层的检测结果改进检测性能,尚未完成最终融合之前,在部分融合的层上就开始检测,会有多层的检测,最终将多个检测结果进行融合)。

这一类研究思路的代表有两种:

(1)feature不融合:多尺度的feture分别进行预测,然后对预测结果进行综合,如Single Shot MultiBox Detector(SSD),Multi-scale CNN(MS-CNN).

注意:SSD,全称Single Shot MultiBox Detector,是Wei Liu在ECCV 2016上提出的一种目标检测算法,截至目前是主要的检测框架之一,相比Faster RCNN有明显的速度优势,相比YOLO又有明显的mAP优势(不过已经被CVPR 2017的YOLO9000超越)。

MS-CNN:cNN多尺度

(2)feature进行金字塔融合,融合后进行预测,如Feature Pyramid Network(FPN)等

注意:FPN全称是Feature Pyramid Network, 也就是特征金字塔网络,主要是针对图像中目标的多尺度的这个特点提出的,多尺度在目标检测中非常常见,而且对应不同的问题应该设计不同的FPN。

特征融合的分类和方法(特征融合add)

3、深度特征融合和高低层特征融合的方法

(1)早融合,用经典的特征融合的方法 ,在现有的网络(如VGG19)中,用concat或add融合其中的某几层。

变种:用DCA特征融合方法替代concat和add操作。

(2)晚融合,采用类似特征金字塔网络(FPN)的思想,对特征融合进行预测。(FPN一般用于目标检测,提高小目标检测能力)。

三个变种:

YOLO2的方法,只在金字塔的top-down路径的最后一层进行预测,此外还有 U-Net [31] and SharpMask for segmentation, Recombinator networks for face detection, and Stacked Hourglass networks for keypoint estimation;YOLO3的方法,在金字塔的每一层都进行预测;FSSD的方法,对 FPN进行细微改造;

feature不融合,多尺度的feature分别进行预测,然后对预测结果进行综合。

(3)用一个具有高低特征融合能力的网络代替普通的网络,如Densenet。

(4)不进行高低层特征融合,而是在高层特征预测的基础上,再用底层特征进行预测结果的调整。

4、DCA特征融合的方法

特征融合的目的,是把从图像中提取的特征,合并成一个比输入特征更具有判别能力的特征。

基于CCA(典型关联分析)的融合方法,就是使用两个输入特征间的相关关系,计算两种变换后的特征比输入的两个特征集具有更高的相关性。CCA的主要不足,在于忽略了数据集中类结构间的关系,所以将每组特征中类分开,为了解决CCA的弱点,引入了DCA。DCA最大化两个特征及中对应特征的相关关系,同时最大化不同类之间的差异。

5、改进的SSD目标检测算法(DeseNet)

改进在于使用Dense net代替原始SSD结构中的VGG,以提高目标检测准确性,改进后的SSD网络对小物体产生很好的拟合。

DeseNet(密集卷积网络)

6、FPN(特征金字塔)

特征金字塔是识别不同尺度的目标时常用的结构,但是特征金字塔需要较大的计算量和显存,所以为了解决这一问题,开发了一种构建特征金字塔的新方法,可以减少额外的对计算量和显存的消耗。

7、YOLO

YOLOv2网络结构中有一个特殊的转换层(Passthrough Layer),假设最后提取的特征图的大小是1313,转换层的作用就是将前面的2626的特征图和本层的1313的特征图进行堆积(扩充特征维数据量),而后进行融合,再用融合后的特征图进行检测。这么做是为了加强算法对小目标检测的精确度。为达更好效果,YOLOv3将这一思想进行了加强和改进。

YOLO v3采用(类似FPN)上采样和融合做法,融合了3个尺度(13x13、26X26和52x52),在多个尺度的融合特征图上分别独立做检测,最终对于小目标的检测效果提升明显。(有些算法采用多尺度特征融合的方式,但是一般是采用融合后的单一特征图做预测,比如YOLOv2,FPN不一样的地方在于其预测是在不同特征层进行的。)  

本文链接地址:https://www.jiuchutong.com/zhishi/300317.html 转载请保留说明!

上一篇:好家伙,9:00面试,9:06就出来了,问的实在是太...(好家伙41集)

下一篇:身份证号码的正则表达式及验证详解(JavaScript,Regex)(身份证号码的正确读法)

  • mate30pro换屏幕还防水吗(mate30pro换屏幕还好用吗)

    mate30pro换屏幕还防水吗(mate30pro换屏幕还好用吗)

  • 小米10pro相机怎么用(小米10pro相机怎么设置)

    小米10pro相机怎么用(小米10pro相机怎么设置)

  • 华为售后给换充电器吗(华为售后换充电口人工费多少钱)

    华为售后给换充电器吗(华为售后换充电口人工费多少钱)

  • 华为荣耀9x可以开空调吗(华为荣耀9X可以投屏吗)

    华为荣耀9x可以开空调吗(华为荣耀9X可以投屏吗)

  • z170主板配什么cpu(z170主板配什么风扇)

    z170主板配什么cpu(z170主板配什么风扇)

  • 更新qq版本在哪里更新(qq更新最新版本在哪里)

    更新qq版本在哪里更新(qq更新最新版本在哪里)

  • 笔记本可以开热点给手机用吗(笔记本可以开热点吗win7)

    笔记本可以开热点给手机用吗(笔记本可以开热点吗win7)

  • qq密保手机号是什么意思(qq密保手机号是陌生人的)

    qq密保手机号是什么意思(qq密保手机号是陌生人的)

  • 手机的充电口芯片歪了(手机的充电口芯片叫什么)

    手机的充电口芯片歪了(手机的充电口芯片叫什么)

  • cpukf是什么意思(cpu的kf是什么意思)

    cpukf是什么意思(cpu的kf是什么意思)

  • 打印机双面打印长边翻页是什么意思(打印机双面打印了一面,怎么打印另外一面)

    打印机双面打印长边翻页是什么意思(打印机双面打印了一面,怎么打印另外一面)

  • 华为p20lite有语音助手吗(华为p20语音输入怎么设置)

    华为p20lite有语音助手吗(华为p20语音输入怎么设置)

  • oppor11s充电器多少w(oppor11充电器多少a)

    oppor11s充电器多少w(oppor11充电器多少a)

  • 抖音限流是什么意思(抖音限流是什么原因造成的)

    抖音限流是什么意思(抖音限流是什么原因造成的)

  • 抖音作品怎么转私密(抖音作品怎么转发到微信朋友圈)

    抖音作品怎么转私密(抖音作品怎么转发到微信朋友圈)

  • word不能编辑怎么处理(word不能编辑怎么解除)

    word不能编辑怎么处理(word不能编辑怎么解除)

  • iqoo是否有耳机孔(iqoo3有耳机接口吗)

    iqoo是否有耳机孔(iqoo3有耳机接口吗)

  • CAD中如何设置点样式(cad如何设置点样式)

    CAD中如何设置点样式(cad如何设置点样式)

  • 为什么苹果设置里面无法取消订阅的项目(为什么苹果设置壁纸那么模糊)

    为什么苹果设置里面无法取消订阅的项目(为什么苹果设置壁纸那么模糊)

  • iphonex快充支持多少w(iphonex快充支持多少a)

    iphonex快充支持多少w(iphonex快充支持多少a)

  • 计算机操作系统是(计算机操作系统在哪里看)

    计算机操作系统是(计算机操作系统在哪里看)

  • uefi和legacy的区别对比(uefi和legacy的区别对显卡兼容)

    uefi和legacy的区别对比(uefi和legacy的区别对显卡兼容)

  • 白兰花的养殖方法与注意事项(白兰花的养殖方法和注意事项和病虫害)

    白兰花的养殖方法与注意事项(白兰花的养殖方法和注意事项和病虫害)

  • WordPress正在执行例行维护,请一分钟后回来解决方法(wordpress运行缓慢)

    WordPress正在执行例行维护,请一分钟后回来解决方法(wordpress运行缓慢)

  • 金融企业 税
  • 企业进入
  • 含税销售额换算成不含税销售额的公式是什么?
  • 出租车发票可以重新打印吗
  • 一千万人民币可以买多少斤黄金
  • 影响无形资产项目金额的有
  • 无法支付的应付账款转销
  • 汽车租赁的印花税税率
  • 收到抵物广告费的会计处理怎么做?
  • 应缴国库款和应交税款
  • 公司预付签证费怎么入账
  • 私立医院整容效果都不行吗
  • 贷款的印花税税率
  • 待处理财产损益是什么意思
  • 没有对公账户的公司怎么注销
  • 重庆个人住房房产税申报
  • 企业收取房屋维修费用
  • 金税盘发票份数没有显示
  • 金蝶结转损益后怎么进下一期
  • 个税申报系统的备份保留几份数据
  • 有现金折扣的采购业务全流程
  • 企业收到政府扶贫资金补助及运用补助金怎么做账
  • linux限制用户访问文件
  • 年终结算增值税怎么算
  • msqry32.exe进程是什么文件 作用是什么 msqry32进程查询
  • 塞巴斯蒂安电影 豆瓣
  • eslint不起作用
  • es6面试题promise
  • 支付宝服务窗支付是啥
  • thinkphp官网
  • 微信随机红包表情包怎么弄
  • 待处理财产损益期末结转到哪里
  • 删除python包
  • db2入门视频教程
  • mysql日志记录
  • 自来水适用3%税率还是9%税率
  • 企业累计预扣个税是什么
  • 资源税类的税种是
  • 积分获取和消费的关系
  • 视同销售收入是纳税调整项目吗?
  • 负债与所有者权益比率计算公式
  • 采购暂估业务处理流程
  • 印花税漏报,税务局怎么罚款
  • 固定资产可资本化的后续支出
  • 无形资产当年提摊销嘛
  • 门面转让费做账怎么做
  • 重分类调整分录是什么
  • 建筑工地塔吊租赁会计分录
  • 商业零售企业商品进销差价
  • 在一台服务器上安装软件
  • sql触发器使用存储过程
  • xp系统的输入法在哪里设置
  • win7那些自启可以禁用
  • dns server配置
  • macbook开机壁纸怎么设置
  • linux的用法
  • xp系统如何查看系统配置
  • win7 ie
  • WIN7如何关闭自动关机
  • 在linux中使用ssh远程调试后目标板的输出在哪里
  • excel嵌入图片变成代码怎么办
  • 优质安卓应用
  • 批处理作用
  • js的isnan
  • javascript闭包函数
  • nodejs连接sqlserver数据库
  • 安卓字库ic
  • js深度拷贝的方法
  • shell中的括号
  • JavaSacript中charCodeAt()方法的使用详解
  • python流数据
  • 安卓快速开发平台
  • 原始凭证审核会计科目吗
  • 职工教育经费可以结转吗
  • 北京市国家税务局发票查询平台
  • 财税专家刘杨简历
  • 大同地税局地址
  • 股东向公司借款合法吗
  • 上海地税定额发票在哪开
  • 税务稽查局工资高吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设