位置: IT常识 - 正文

深度学习中的FPN详解

编辑:rootadmin
深度学习中的FPN详解

推荐整理分享深度学习中的FPN详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。

目录

一、FPN提出原因

二、FPN的参考思想

三、特征金字塔

 四、FPN具体思路

一、FPN提出原因

卷积网络中,深层网络容易响应语义特征,浅层网络容易响应图像特征。然而,在目标检测中往往因为卷积网络的这个特征带来了不少麻烦:

高层网络虽然能响应语义特征,但是由于Feature Map的尺寸太小,拥有的几何信息并不多,不利于目标的检测;浅层网络虽然包含比较多的几何信息,但是图像的语义特征并不多,不利于图像的分类。这个问题在小目标检测中更为突出。

因此,如果我们能够合并深层和浅层特征的话,同时满足目标检测和图像分类的需要,那我们的问题可能就迎刃而解啦~

二、FPN的参考思想

既然我们的FPN是特征金字塔,当然参考的也与金字塔有关啦。

FPN使用的是图像金字塔的思想。

传统的图像金字塔采用输入多尺度图像的方式构建多尺度的特征。简单来说,就是我们输入一张图像后,我们可以通过一些手段获得多张不同尺度的图像,我们将这些不同尺度的图像的4个顶点连接起来,就可以构造出一个类似真实金字塔的一个图像金字塔。整个过程有点像是我们看一个物品由远及近的过程(近大远小原理)。

其中,中间的图像是原始图像,尺寸越来越小的图片是经过下采样处理后的结果,而尺寸越来越大的图片是经过上采样处理后的结果。这样我们可以提取到更多的有用的信息。

三、特征金字塔

运用这种金字塔的思想可以提高算法的性能,但是他需要大量的运算和内存。

因此特征金字塔要在速度和准确率之间进行权衡,通过它获得更加鲁棒的语义信息。

图像中存在不同大小的目标,而不同的目标具有不同的特征,所以我们需要特征金字塔来利用浅层的特征将简单的目标区分开,利用深层的特征将复杂的目标区分开。即利用大的特征图区分简单目标,利用小的特征图区分复杂目标。

 四、FPN具体思路

提出的思路如下图所示:

深度学习中的FPN详解

图(a):

先对原始图像构造图像金字塔,然后在图像金字塔的每一层提出不同的特征,然后进行相应的预测。优点:精度不错;缺点:计算量大得恐怖,占用内存大。直接pass!

图(b):

通过对原始图像进行卷积和池化操作来获得不同尺寸的feature map,在图像的特征空间中构造出金字塔。

因为浅层的网络更关注于细节信息,高层的网络更关注于语义信息,更有利于准确检测出目标,因此利用最后一个卷积层上的feature map来进行预测分类。

优点:速度快、内存少。缺点:仅关注深层网络中最后一层的特征,却忽略了其它层的特征。

图(c):

同时利用低层特征和高层特征。就是首先在原始图像上面进行深度卷积,然后分别在不同的特征层上面进行预测。

优点:在不同的层上面输出对应的目标,不需要经过所有的层才输出对应的目标(即对于有些目标来说,不用进行多余的前向操作),速度更快,又提高了算法的检测性能。

缺点:获得的特征不鲁棒,都是一些弱特征(因为很多的特征都是从较浅的层获得的)。

图(d)这才是我们真正的FPN

 简单概括来说就是:自下而上,自上而下,横向连接和卷积融合。

整体过程:

(1)自下而上:先把预处理好的图片送进预训练的网络,比如像ResNet这些,这一步就是构建自下而上的网络,就是对应下图中的(1,2,3)这一组金字塔。

(2)自上而下:将层3进行一个复制变成层4,对层4进行上采样操作(就是2 * up),再用1 * 1卷积对层2进行降维处理,然后将两者对应元素相加(这里就是高低层特征的一个汇总),这样我们就得到了层5,层6以此类推,是由层5和层1进行上述操作得来的。这样就构成了自上而下网络,对应下图(4,5,6)金字塔。(其中的层2与上采样后的层4进行相加,就是横向连接的操作)

(3)卷积融合:最后我们对层4,5,6分别来一个3 * 3卷积操作得到最终的预测(对应下图的predict)。

欢迎大家在评论区批评指正~

本文链接地址:https://www.jiuchutong.com/zhishi/298943.html 转载请保留说明!

上一篇:jsoup的使用(jsoup js)

下一篇:vue-router路由懒加载(vue router-view路由详解)

  • 华为nova7卡槽在哪个位置(华为nova7手机卡槽)

    华为nova7卡槽在哪个位置(华为nova7手机卡槽)

  • 苹果官网和京东自营的区别(苹果官网和京东质量一样吗)

    苹果官网和京东自营的区别(苹果官网和京东质量一样吗)

  • 美团拉新用户怎么操作(美团拉新怎么拉)

    美团拉新用户怎么操作(美团拉新怎么拉)

  • 微信更新了怎么没有深色模式(微信更新了怎么换回旧版本)

    微信更新了怎么没有深色模式(微信更新了怎么换回旧版本)

  • 京东7天无理由退货运费谁出(京东7天无理由退货钱多久到账)

    京东7天无理由退货运费谁出(京东7天无理由退货钱多久到账)

  • 美团骑手要交多少押金(美团骑手需要交税吗)

    美团骑手要交多少押金(美团骑手需要交税吗)

  • 钉钉直播有回声怎么办(钉钉直播有回声重复说话)

    钉钉直播有回声怎么办(钉钉直播有回声重复说话)

  • 微信消费记录删除了可以查出来吗(微信消费记录删除需要人脸验证)

    微信消费记录删除了可以查出来吗(微信消费记录删除需要人脸验证)

  • 光信号不亮算是正常吗(为啥光信号不亮)

    光信号不亮算是正常吗(为啥光信号不亮)

  • 腾讯视频只有声音没有画面怎么回事(腾讯视频只有声音没画面)

    腾讯视频只有声音没有画面怎么回事(腾讯视频只有声音没画面)

  • qc3.0快充是多少a(qc3.0快充是多少W)

    qc3.0快充是多少a(qc3.0快充是多少W)

  • 手机连拍怎么设置(手机连拍在哪里设置间隔时间)

    手机连拍怎么设置(手机连拍在哪里设置间隔时间)

  • 苹果手机为什么不显示4g网络(苹果手机为什么那么贵)

    苹果手机为什么不显示4g网络(苹果手机为什么那么贵)

  • powerpoint是应用软件吗(powerpoint属于应用软件吗?)

    powerpoint是应用软件吗(powerpoint属于应用软件吗?)

  • 国行有卡贴机吗(国行卡贴机是怎么回事)

    国行有卡贴机吗(国行卡贴机是怎么回事)

  • reset键盘哪个位置(reset健在哪个位置)

    reset键盘哪个位置(reset健在哪个位置)

  • 手机卸载的软件怎么恢复(手机卸载的软件怎么彻底清除)

    手机卸载的软件怎么恢复(手机卸载的软件怎么彻底清除)

  • wps删除空白页删不掉(wps怎么删除空白页)

    wps删除空白页删不掉(wps怎么删除空白页)

  • 苹果x自带耳机插哪里(iphone x自带的耳机是什么接口)

    苹果x自带耳机插哪里(iphone x自带的耳机是什么接口)

  • 小米黑鲨有语音助手吗(小米黑鲨语音助手怎么打开)

    小米黑鲨有语音助手吗(小米黑鲨语音助手怎么打开)

  • 荣耀20pro耳机孔在哪里(荣耀p20pro耳机孔)

    荣耀20pro耳机孔在哪里(荣耀p20pro耳机孔)

  • 苹果11有指纹吗(苹果手机有指纹吗)

    苹果11有指纹吗(苹果手机有指纹吗)

  • 荣耀手环4能测血压吗(荣耀手环4测血氧)

    荣耀手环4能测血压吗(荣耀手环4测血氧)

  • 步数宝寒冬补助怎么领不了(步数宝怎么样)

    步数宝寒冬补助怎么领不了(步数宝怎么样)

  • vivox6支持红外线吗(vivox6有没有红外)

    vivox6支持红外线吗(vivox6有没有红外)

  • 小规模收到专票怎么处理
  • 机械租赁适用税率
  • 实收资本印花税是营业账簿吗
  • 转出未交增值税是借方还是贷方
  • 发票货物名称前带星号规定
  • 营业外收入做销项税调整
  • 17点是多少点
  • 企业年金如何缴费标准
  • 进口货物的应纳增值税
  • 广告合同印花税率怎么算
  • 2020年个体工商户税收政策超出额度怎么征收
  • 采购退货红字发票怎么写
  • 原材料购入和转出做账
  • 生产企业原材料的订购与运输论文
  • 建筑企业收到的成本发票可以直接进主营业务成本吗
  • 电信话费可以开公司发票吗
  • 资产负债表属于会计报表吗
  • 去年红字发票怎么做账
  • 必要收益率的计算题目
  • 增值税发票备注栏怎么填写
  • 加盟费是一年一收还是终身的
  • 出售交易性金融资产的记账凭证
  • c盘空间变小的原因
  • 询证函有法律效力吗
  • 什么是个别资本的概念
  • 委托检验报告能否作为处罚依据
  • 汇算清缴当年分配的股息红利
  • 冲回坏账
  • 如何调整任务栏图标大小
  • 认定科技型中小企业简单吗
  • lsalss.exe
  • u深度u盘启动盘制作工具官网
  • 跨年收到退回增值税税款的账务处理
  • php新手入门
  • 出现巨石
  • 酒店客房收入怎么算
  • [ChatGPT] 从 GPT-3.5 到 GPT-5 的进化之路 | ChatGPT和程序员 : 协作 or 取代
  • 代垫运费的增值税可以抵扣吗
  • php源码封装
  • 增值税季度缴纳时间
  • MyBatis MapperProvider MessageFormat拼接批量SQL语句执行报错的原因分析及解决办法
  • 支付长期借款利息时,应借记什么账户
  • 耕地占用税如何计算
  • 税控盘上月未清卡去税务带什么
  • mysql存long
  • 租赁中承租人的会计分录
  • 消费税是怎样征收的
  • 调账和调帐区别
  • 营业外收入应如何核算
  • 进项已抵扣,退货发票怎么处理
  • 应收账款有什么
  • 销售货物海运费会计分录
  • 防伪标内容
  • 为什么自创商誉不能确认
  • 金税盘服务费可以抵扣增值税进项税额吗
  • 高新企业研发项目规定几个
  • 购入固定资产一次性税前扣除
  • 帮客户支付的机票计入什么科目
  • 银行汇票的适用主体
  • sql2005定时备份数据库
  • sql server数据库使用
  • vista windows
  • 修改双系统的引导顺序
  • xp系统的存储在哪里
  • ubuntu做lvm
  • win8系统怎么更改系统语言
  • win8系统升级
  • win7j
  • Win7系统可以装ie10浏览器么
  • python opencv
  • linux中命令行
  • pycharm中文教程
  • Node.js中的事件循环是什么样的
  • unity camera fov
  • javascript中的数据类型分为两大类
  • MVC+jQuery.Ajax异步实现增删改查和分页
  • 年终奖发4万扣多少税
  • 陕西省网上税务局怎么报国税(陕西税务局官网申报)
  • 上饶税务局电话号码
  • 小规模和一般纳税人营业执照区别
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设