位置: IT常识 - 正文

深度学习中的FPN详解

编辑:rootadmin
深度学习中的FPN详解

推荐整理分享深度学习中的FPN详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。

目录

一、FPN提出原因

二、FPN的参考思想

三、特征金字塔

 四、FPN具体思路

一、FPN提出原因

卷积网络中,深层网络容易响应语义特征,浅层网络容易响应图像特征。然而,在目标检测中往往因为卷积网络的这个特征带来了不少麻烦:

高层网络虽然能响应语义特征,但是由于Feature Map的尺寸太小,拥有的几何信息并不多,不利于目标的检测;浅层网络虽然包含比较多的几何信息,但是图像的语义特征并不多,不利于图像的分类。这个问题在小目标检测中更为突出。

因此,如果我们能够合并深层和浅层特征的话,同时满足目标检测和图像分类的需要,那我们的问题可能就迎刃而解啦~

二、FPN的参考思想

既然我们的FPN是特征金字塔,当然参考的也与金字塔有关啦。

FPN使用的是图像金字塔的思想。

传统的图像金字塔采用输入多尺度图像的方式构建多尺度的特征。简单来说,就是我们输入一张图像后,我们可以通过一些手段获得多张不同尺度的图像,我们将这些不同尺度的图像的4个顶点连接起来,就可以构造出一个类似真实金字塔的一个图像金字塔。整个过程有点像是我们看一个物品由远及近的过程(近大远小原理)。

其中,中间的图像是原始图像,尺寸越来越小的图片是经过下采样处理后的结果,而尺寸越来越大的图片是经过上采样处理后的结果。这样我们可以提取到更多的有用的信息。

三、特征金字塔

运用这种金字塔的思想可以提高算法的性能,但是他需要大量的运算和内存。

因此特征金字塔要在速度和准确率之间进行权衡,通过它获得更加鲁棒的语义信息。

图像中存在不同大小的目标,而不同的目标具有不同的特征,所以我们需要特征金字塔来利用浅层的特征将简单的目标区分开,利用深层的特征将复杂的目标区分开。即利用大的特征图区分简单目标,利用小的特征图区分复杂目标。

 四、FPN具体思路

提出的思路如下图所示:

深度学习中的FPN详解

图(a):

先对原始图像构造图像金字塔,然后在图像金字塔的每一层提出不同的特征,然后进行相应的预测。优点:精度不错;缺点:计算量大得恐怖,占用内存大。直接pass!

图(b):

通过对原始图像进行卷积和池化操作来获得不同尺寸的feature map,在图像的特征空间中构造出金字塔。

因为浅层的网络更关注于细节信息,高层的网络更关注于语义信息,更有利于准确检测出目标,因此利用最后一个卷积层上的feature map来进行预测分类。

优点:速度快、内存少。缺点:仅关注深层网络中最后一层的特征,却忽略了其它层的特征。

图(c):

同时利用低层特征和高层特征。就是首先在原始图像上面进行深度卷积,然后分别在不同的特征层上面进行预测。

优点:在不同的层上面输出对应的目标,不需要经过所有的层才输出对应的目标(即对于有些目标来说,不用进行多余的前向操作),速度更快,又提高了算法的检测性能。

缺点:获得的特征不鲁棒,都是一些弱特征(因为很多的特征都是从较浅的层获得的)。

图(d)这才是我们真正的FPN

 简单概括来说就是:自下而上,自上而下,横向连接和卷积融合。

整体过程:

(1)自下而上:先把预处理好的图片送进预训练的网络,比如像ResNet这些,这一步就是构建自下而上的网络,就是对应下图中的(1,2,3)这一组金字塔。

(2)自上而下:将层3进行一个复制变成层4,对层4进行上采样操作(就是2 * up),再用1 * 1卷积对层2进行降维处理,然后将两者对应元素相加(这里就是高低层特征的一个汇总),这样我们就得到了层5,层6以此类推,是由层5和层1进行上述操作得来的。这样就构成了自上而下网络,对应下图(4,5,6)金字塔。(其中的层2与上采样后的层4进行相加,就是横向连接的操作)

(3)卷积融合:最后我们对层4,5,6分别来一个3 * 3卷积操作得到最终的预测(对应下图的predict)。

欢迎大家在评论区批评指正~

本文链接地址:https://www.jiuchutong.com/zhishi/298943.html 转载请保留说明!

上一篇:jsoup的使用(jsoup js)

下一篇:vue-router路由懒加载(vue router-view路由详解)

  • 微信怎么设置信用卡收款功能(微信怎么设置信息提示)

    微信怎么设置信用卡收款功能(微信怎么设置信息提示)

  • 抖音作品怎么批量删除(抖音作品怎么批量删除视频)

    抖音作品怎么批量删除(抖音作品怎么批量删除视频)

  • 华为手机字体怎么更换简体(华为手机字体怎么调大小)

    华为手机字体怎么更换简体(华为手机字体怎么调大小)

  • 抖音怎么换评论的背景(抖音怎么换评论颜色)

    抖音怎么换评论的背景(抖音怎么换评论颜色)

  • 微信不能领群里的红包(微信群里不能领红包)

    微信不能领群里的红包(微信群里不能领红包)

  • 网易云蓝牙耳机怎么恢复双耳模式(网易云蓝牙耳机值得买吗)

    网易云蓝牙耳机怎么恢复双耳模式(网易云蓝牙耳机值得买吗)

  • 打马赛克的图片可以还原吗(打马赛克的图片怎么看到原来的内容)

    打马赛克的图片可以还原吗(打马赛克的图片怎么看到原来的内容)

  • 12123用户被占用(交管12123账号被占用)

    12123用户被占用(交管12123账号被占用)

  • airpods盒子丢了能配吗(airpods盒子丢了可以再买一个直接用吗)

    airpods盒子丢了能配吗(airpods盒子丢了可以再买一个直接用吗)

  • 多媒体课件主要有哪些种类(多媒体课件主要教学功能)

    多媒体课件主要有哪些种类(多媒体课件主要教学功能)

  • 为什么最近看抖音老卡(为什么最近看抖音都是卡卡的)

    为什么最近看抖音老卡(为什么最近看抖音都是卡卡的)

  • 为什么登录保护关了还要验证(为什么登录保护的设备显示不全)

    为什么登录保护关了还要验证(为什么登录保护的设备显示不全)

  • 微信调成听筒模式怎么调回来

    微信调成听筒模式怎么调回来

  • 苹果手机短信一直显示有未读(苹果手机短信一键删除)

    苹果手机短信一直显示有未读(苹果手机短信一键删除)

  • a57支持电信卡吗(a57支持电信卡吗怎么设置)

    a57支持电信卡吗(a57支持电信卡吗怎么设置)

  • 苹果6s如何强制关机重启(苹果6s如何强制降级)

    苹果6s如何强制关机重启(苹果6s如何强制降级)

  • a1474是ipad什么型号尺寸(a1474是ipad什么型号买壳)

    a1474是ipad什么型号尺寸(a1474是ipad什么型号买壳)

  • 常见的音频格式有哪些(常见的音频格式有哪几种)

    常见的音频格式有哪些(常见的音频格式有哪几种)

  • 华为和苹果怎么互相定位(华为和苹果怎么互传视频)

    华为和苹果怎么互相定位(华为和苹果怎么互传视频)

  • 抖音从哪里看访客记录(抖音从哪里看访问主页记录)

    抖音从哪里看访客记录(抖音从哪里看访问主页记录)

  • 和我信为什么领不了流量(和我信为什么不见了)

    和我信为什么领不了流量(和我信为什么不见了)

  • 手机通知栏hd怎么关闭(手机通知栏hd收费吗)

    手机通知栏hd怎么关闭(手机通知栏hd收费吗)

  • 不打开微信步数会更新吗(不打开微信步数会变化吗)

    不打开微信步数会更新吗(不打开微信步数会变化吗)

  • oppor15备忘录在哪里(oppr15备忘录在哪)

    oppor15备忘录在哪里(oppr15备忘录在哪)

  • 最右为什么没帖子了(为什么最右的帖子别人看不到)

    最右为什么没帖子了(为什么最右的帖子别人看不到)

  • smartart图形怎么添加(smartart图形怎么添加下一层)

    smartart图形怎么添加(smartart图形怎么添加下一层)

  • 什么情况下要交环保税
  • 企业的进项税额怎么算
  • 虚开增值税如何获利
  • 个人所得税怎么申报退税
  • 一般计税方法和简易计税方法的计算公式
  • 所得税费用是什么要素
  • 开发成本需要结转到存货吗
  • 税控系统的清单
  • 企业所得税申报时间
  • 车间领用材料应填制什么凭证
  • 雇主责任险保费计算公式
  • 高速过路费抵扣增值税
  • 供应商货款打折分录
  • 税负的含义
  • 同一套房
  • 企业收到经营外的发票如何做账
  • 价外费用如何开普票
  • 建筑服务税率是5
  • 固定资产一次性扣除政策2023文件
  • 自然人转让股权税收筹划
  • 运费专票当月如何入账
  • 固定资产不动产和动产的区别
  • 个税如何绑定新公司
  • 资产损失税前扣除
  • 股票质押得到的钱怎么算
  • 在建工程如何评估价值
  • 分公司使用总公司业绩投标
  • macbook设置壁纸后开机变回原样
  • 英雄联盟登录失败7502013
  • 什么货物出口最多
  • 预付维修费计入入账价值吗
  • 苹果官网入口
  • 百度有钱花借钱会上征信吗
  • 实际借款成本率
  • 信用减值损失在借方是增加还是减少
  • 建账初期的库存商品录入
  • 融资购入的固定资产如何记账
  • 如何用java写接口
  • php header refresh
  • 其他货币资金明细科目有哪些
  • php模拟post提交
  • 如何使用openAI总结小说内容
  • btrfs 读取
  • 视图机制
  • 数据模型 excel
  • php经典面试题及答案
  • rm -rf/指令指删除什么
  • 怎么查询开具的红字发票
  • 怎么填专项扣除
  • php安装了还要配置吗
  • MongoDB db.serverStatus()输出内容中文注释
  • 停车费不动产租赁税率
  • 会议期间的餐费算会务费吗
  • 城市维护建设税,教育费附加,地方教育费附加
  • 公司基本户里的钱有利息吗
  • 营业成本包含哪些项目
  • 广告费的税费分录
  • 业务招待费汇算清缴账务处理
  • 餐饮企业原材料采购描述错误的是
  • 库存商品盘点制度
  • 房地产项目开发的基本流程是什么
  • 印花税的计算公式应纳税所得额包含增值税吗
  • 补缴的增值税可以抵扣吗
  • 注销公司剩余的钱怎么办
  • 建账有几种方法
  • mysql数据库内存缓存设置
  • mac怎么用浏览器
  • 电脑上view是什么意思
  • WIN7系统怎么安装 注音输入法
  • wind移动版
  • linux入门很简单
  • python urllib urlopen
  • nodejs的理解
  • bat查看ip地址和mac地址
  • nodejs使用场景
  • 企业欠税补交后影响贷款吗
  • 贸易型企业进项发票
  • 钢结构蔬菜大棚造价多少钱一平方
  • 重芳烃闪点70,初馏点是多少
  • 北京地税局上班时间查询
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设