位置: IT常识 - 正文

常见经典目标检测算法(经典目标检测算法)

编辑:rootadmin
常见经典目标检测算法 1、目标检测基本概念1.1 什么是目标检测

推荐整理分享常见经典目标检测算法(经典目标检测算法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:常用的目标检测算法有哪些,常见的目标,常用的目标检测算法有哪些,经典目标检测的基本思想,常用目标检测方法,常见目标类型,常见目标类型,常用目标检测方法,内容如对您有帮助,希望把文章链接给更多的朋友!

目标检测(Object Dectection)的任务是找出图像中所有感兴趣的目标(物体),确定他们的类别和位置。

1.2 目标检测要解决的核心问题

除图像分类外,目标检测要解决的核心问题是: 1.目标可能出现在图像的任何位置。 2.目标有各种不同的大小。 3.目标可能有各种不同的形状。

1.3 目标检测算法分类Two stage目标检测算法 先进行区域生成(region proposal,RP)(一个可能包含待检测物体的预选框),再通过卷积神经网络进行样本分类。 任务:特征提取->生成RP->分类/定位回归。 常见Two stage目标检测算法有:R-CNN、SPP-Net、Fast R-CNN和R-FCN等。One stage 目标检测算法 不用RP,直接在网络中提取特征来预测物体分类和位置。 任务:特征提取->分类/定位回归。 常见的one stage目标检测算法有:OverFeat、YOLOv1、YOLOv3、SSD和RetinaNet等。 1.4 应用领域人脸检测行人检测车辆检测道路检测障碍物检测等等2、Two stage 目标检测算法2.1 R-CNN2.1.1 R-CNN 创新点使⽤CNN(ConvNet)对 region proposals 计算 feature vectors。从经验驱动特征(SIFT、HOG)到数据驱动特征(CNN feature map),提⾼特征对样本的表⽰能⼒。采⽤⼤样本下(ILSVRC)有监督预训练和⼩样本(PASCAL)微调(fine-tuning)的⽅法解决⼩样本难以训练甚⾄过拟合等问题。

注:ILSVRC其实就是众所周知的ImageNet的挑战赛,数据量极⼤;PASCAL数据集(包含⽬标检测和图像分割等),相对较⼩。

2.1.2 R-CNN 介绍

R-CNN作为R-CNN系列的第⼀代算法,其实没有过多的使⽤“深度学习”思想,⽽是将“深度学习”和传统的“计算机视觉”的知识相结合。⽐如R-CNN pipeline中的第⼆步和第四步其实就属于传统的“计算机视觉”技术。使⽤selective search提取region proposals,使⽤SVM实现分类。

预训练模型。选择一个预训练模型(pre-trained)神经网络(如AlexNet、VGG)。

重新训练全连接层使用需要检测的目标重新训练(re-train)最后全连接层(connected layer)。

常见经典目标检测算法(经典目标检测算法)

提取prosals并计算CNN特征。利用选择性搜索(Slective Search)算法提取所有prosals(大约2000幅images),调整(resize/warp)它们固定大小,以满足CNN输入,然后将feature map保存到本地磁盘。

训练SVM。利用feature map训练SVM来对目标和背景进行分类(每个类一个二进制SVM)。

边界框回归(Bounding boxes Regression)。训练将输出一些校正因子的线性回归分类器。

2.1.3 R-CNN实验结果

R-CNN在VOC 2007测试集上mAP达到58.5%,打败当时所有的⽬标检测算法。

2.2 Fast R-CNN2.2.1 Fast R-CNN有哪些创新点?只对整幅图像进行一次特征提取。⽤RoI pooling层替换最后⼀层的max pooling层,同时引⼊建议框数据,提取相应建议框特征。Fast R-CNN⽹络末尾采⽤并⾏的不同的全连接层,可同时输出分类结果和窗⼝回归结果, 实现了end-to-end的多任务训练【建议框提取除外】,也不需要额外的特征存储空间【RCNN中的特征需要保持到本地,来供SVMBounding-box regression进⾏训练】。采⽤SVD对Fast R-CNN⽹络末尾并⾏的全连接层进⾏分解,减少计算复杂度,加快检测速度。2.2.2 Fast R-CNN 介绍

Fast R-CNN是基于R-CNN和SPPnets进⾏的改进。SPPnets,其创新点在于计算整幅图像的the shared feature map,然后根据object proposal在shared feature map上映射到对应的feature vector(就是不⽤重复计算feature map了)。当然,SPPnets也有缺点:和R-CNN⼀样,训练是多阶段(multiple-stage pipeline)的,速度还是不够"快",特征还要保存到本地磁盘中。

将候选区域直接应⽤于特征图,并使⽤RoI池化将其转化为固定⼤⼩的特征图块。以下是Fast R-CNN的流程图

2.2.3 RoI Pooling 层详解

因为Fast R-CNN使⽤全连接层,所以应⽤RoI Pooling将不同⼤⼩的ROI转换为固定⼤⼩。 RoI Pooling 是Pooling层的⼀种,⽽且是针对RoI的Pooling,其特点是输⼊特征图尺⼨不固定,但是输出特征图尺⼨固定(如7x7)

什么是RoI呢? RoI是Region of Interest的简写,⼀般是指图像上的区域框,但这⾥指的是由Selective Search提取的候选框。提取候选框 往往经过RPN后输出的不⽌⼀个矩形框,所以这⾥我们是对多个RoI进⾏Pooling。RoI Pooling的输入 输⼊有两部分组成:特征图(feature map):指的是上⾯所⽰的特征图,在Fast RCNN中,它位于RoI Pooling 之前,在Faster RCNN中,它是与RPN共享那个特征图,通常我们常常称之 为“share_conv”;RoIs,其表⽰所有RoI的N*5的矩阵。其中N表⽰RoI的数量,第⼀列表⽰图像index,其余四 列表⽰其余的左上⾓和右下⾓坐标。

在Fast RCNN中,指的是Selective Search的输出;在Faster RCNN中指的是RPN的输出,⼀堆矩形候选框,形状为1x5x1x1(4个坐标+索引index),其中值得注意的是:坐标的参考系不是针对feature map这张图的,⽽是针对原图的(神经⽹络最开始的输⼊)。其实关于ROI的坐标理解⼀直很混乱,到底是根据谁的坐标来。其实很好理解,我们已知原图的⼤⼩和由Selective Search算法提取的候选框坐标,那么根据"映射关系"可以得出特征图(featurwe map)的⼤⼩和候选框在feature map上的映射坐标。⾄于如何计算,其实就是⽐值问题,下⾯会介绍。所以这⾥把ROI理解为原图上各个候选框(region proposals),也是可以的。

2.2.4 RoI 的具体操作根据输入image,将ROI映射到feature map 对应位置 注:映射规则比较简单,就是把各个坐标除以“输入图片与feature map的大小的比值”,得到了feature map上的box坐标。 2.将映射后的区域划分为相同大小的sections(sections数量与输出的维度相同) 3.对每个sections进行max pooling操作。

这样我们就可以从不同大小的方框得到固定大小的相应的feature maps。值得⼀提的是,输出的feature maps的大小不取决于ROI和卷积feature maps大小。RoI Pooling 最大的好处就在于极大地提高了处理速度。

2.2.5 ROI Pooling的输出

输出是batch个vector,其中batch的值等于ROI的个数,vector的大小为channelwh;ROI Pooling的过程就是将一个个大小不同的box矩形框,都映射成大小固定(w*h)的矩形框。 ROI Pooling 示例

2.3 Faster R-CNN2.3.1 Faster R-CNN有哪些创新点?

Fast R-CNN依赖于外部候选区域⽅法,如选择性搜索。但这些算法在CPU上运⾏且速度很慢。在测试中,Fast R-CNN需要2.3秒来进⾏预测,其中2秒⽤于⽣成2000个ROI。Faster R-CNN采用与Fast R-CNN相同的设计,只是它⽤内部深层⽹络代替了候选区域⽅法。新的候选区域⽹络(RPN)在⽣成ROI时效率更⾼,并且以每幅图像10毫秒的速度运行。 候选区域⽹络(RPN)将第⼀个卷积网络的输出特征图作为输⼊。它在特征图上滑动⼀个3×3的卷积核,以使用卷积⽹络(如下所示的ZF网络)构建与类别⽆关的候选区域。其他深度⽹络(如VGG或ResNet)可⽤于更全⾯的特征提取,但这需要以速度为代价。ZF网络最后会输出256个值,它们将馈送到两个独立的全连接层,以预测边界框和两个objectness分数,这两个objectness分数度量了边界框是否包含⽬标。我们其实可以使⽤回归器计算单个objectness分数,但为简洁起⻅,Faster R-CNN使⽤只有两个类别的分类器:即带有⽬标的类别和不带有⽬标的类别。

本文链接地址:https://www.jiuchutong.com/zhishi/300632.html 转载请保留说明!

上一篇:JS数组对象——根据日期进行排序Date.parse(),按照时间进行升序或降序排序localeCompare()(js数组entries)

下一篇:html 导入百度地图 网页中如何导入百度地图(html如何导入excel)

  • 提高网店转化率需四招(提高网店转化率及客服服务水平的计划书)

    提高网店转化率需四招(提高网店转化率及客服服务水平的计划书)

  • 苹果手机显示e是怎么回事(苹果手机显示耳机模式怎么关闭)

    苹果手机显示e是怎么回事(苹果手机显示耳机模式怎么关闭)

  • 抖音移除粉丝对方会知道的吗(抖音移除粉丝对方会发现吗)

    抖音移除粉丝对方会知道的吗(抖音移除粉丝对方会发现吗)

  • 微信咋发朋友圈

    微信咋发朋友圈

  • 戴尔笔记本的重启快捷键(戴尔笔记本的重装键在哪)

    戴尔笔记本的重启快捷键(戴尔笔记本的重装键在哪)

  • 下雨天wifi网速变差是怎么回事(下雨天wifi网速变差)

    下雨天wifi网速变差是怎么回事(下雨天wifi网速变差)

  • 怎样登好友qq(怎样登好友qq不用密码)

    怎样登好友qq(怎样登好友qq不用密码)

  • 淘宝淘金币金主兑换日是哪天(淘宝淘金币金主为什么取消)

    淘宝淘金币金主兑换日是哪天(淘宝淘金币金主为什么取消)

  • 什么是圆角屏(什么是圆角屏?)

    什么是圆角屏(什么是圆角屏?)

  • qq里的文件打不开了怎么办(qq里的文件打不开)

    qq里的文件打不开了怎么办(qq里的文件打不开)

  • 激活windows是什么意思(windows激活是什么)

    激活windows是什么意思(windows激活是什么)

  • cpu针脚是什么(cpu针脚是什么金属)

    cpu针脚是什么(cpu针脚是什么金属)

  • windows7桌面是指它的(windows7桌面指什么)

    windows7桌面是指它的(windows7桌面指什么)

  • 苹果自带涂鸦笔在哪里(iphone自带的涂鸦笔到底怎么用)

    苹果自带涂鸦笔在哪里(iphone自带的涂鸦笔到底怎么用)

  • 手写福字可以扫到敬业福吗(能扫出福字)

    手写福字可以扫到敬业福吗(能扫出福字)

  • 桌面云备份可以删除吗(桌面云备份可以删了有影响吗)

    桌面云备份可以删除吗(桌面云备份可以删了有影响吗)

  • 抖音权重是什么东西(抖音权重是什么意思在哪里看)

    抖音权重是什么东西(抖音权重是什么意思在哪里看)

  • 乐视忘记密码怎么办(乐视忘记密码怎么打开)

    乐视忘记密码怎么办(乐视忘记密码怎么打开)

  • 小米8nfc功能使用方法(小米8nfc功能是什么意思怎么使用)

    小米8nfc功能使用方法(小米8nfc功能是什么意思怎么使用)

  • 如何把图片调成300dpi(如何把图片调成微信头像适合的大小)

    如何把图片调成300dpi(如何把图片调成微信头像适合的大小)

  • 3dmax贴图不显示(3dmax2015贴图不显示)

    3dmax贴图不显示(3dmax2015贴图不显示)

  • 腾讯视频保存的图片在哪(腾讯视频保存的视频怎么到手机相册)

    腾讯视频保存的图片在哪(腾讯视频保存的视频怎么到手机相册)

  • 擦除联系痕迹什么意思(擦除联系痕迹对方打电话可以收到吗)

    擦除联系痕迹什么意思(擦除联系痕迹对方打电话可以收到吗)

  • 搜狗搜索如何设置小窗口(搜狗搜索引擎设置)

    搜狗搜索如何设置小窗口(搜狗搜索引擎设置)

  • mac打不开app store怎么办?解决苹果电脑mac App store打不开的方法介绍(mac打不开网页但是可以上微信)

    mac打不开app store怎么办?解决苹果电脑mac App store打不开的方法介绍(mac打不开网页但是可以上微信)

  • fs20.exe是什么进程 有什么作用 fs20进程查询(电脑fs0是什么)

    fs20.exe是什么进程 有什么作用 fs20进程查询(电脑fs0是什么)

  • vue-router.esm.js?a12b:2046 Uncaught (in promise) NavigationDuplicated: Avoided redundant navigation

    vue-router.esm.js?a12b:2046 Uncaught (in promise) NavigationDuplicated: Avoided redundant navigation

  • 鸳鸯妈妈和小鸳鸯们,韩国 (© VDCM image/Getty Images)(鸳鸯小鸟)

    鸳鸯妈妈和小鸳鸯们,韩国 (© VDCM image/Getty Images)(鸳鸯小鸟)

  • 增值税明细账用三栏式还是多栏式
  • 提取法定盈余公积是什么意思
  • 劳务报酬和工资薪金哪个税率高
  • 小企业需要计提法定盈余公积吗
  • 增值税13%税率有哪些
  • 个人所得税哪里报税
  • 固定资产融资租出计入什么科目
  • 报废过期产品怎么做会计分录
  • 企业如何实现合理利润
  • 贸易公司委托加工买进和卖出东西不一样
  • 计提贷款损失准备金遵循以下原则
  • 应收款抹零计入什么会计科目
  • 研发费用准备金计提账务处理
  • 税控盘抵税账务处理
  • 劳务发票属地原则
  • 物业管理行业税点
  • 印花税在什么情况下需要申报
  • 完税凭证是什么
  • 防伪税控开具发票明细表
  • 出口货物怎么开具发票
  • windows刷新桌面
  • 支付挂靠方的管理费用有进项吗?
  • 营业利润投资收益是借方还是贷方
  • PHP:imagepsslantfont()的用法_GD库图像处理函数
  • 交通运输业成本构成比例
  • 集团内部资金拆借利息增值税
  • 旅游企业税务筹划
  • 阿尔莫什
  • cobit框架
  • 社保缴费工资和实发工资不一样
  • 前端实战面试题
  • Yii2实现同时搜索多个字段的方法
  • 款付了对方没开发票咋办
  • 培训费用是什么成本
  • 填写发票票种核实怎么填
  • 营业外收支的账户是什么
  • 筹建期工会经费怎么算
  • python怎么运行程序
  • 购买的优惠卷到期后退款
  • u8已经记账的凭证怎么修改
  • sql数据库降低版本
  • 结转本月应交增值税
  • 开了发票不做收入的账务处理是?
  • 产权出典是啥意思
  • 季度亏损需要计提企业所得税吗
  • 报销电话费计入什么科目
  • 先抵扣后付款怎么做账
  • 企业减资要交税嘛
  • 去年的福利费没有用完,今年可以用吗
  • 测距仪计入什么科目
  • 微信转账和支付宝转账有法律效力么
  • 银行账与实际账不符
  • 银行存款明细账借方代表什么
  • sql 随机
  • mysql分页性能
  • windows写字板功能
  • windowsxp查ip地址
  • 如何修改apache
  • linux关闭sh
  • 在mac中运行exe
  • win8.1使用教程
  • win7系统图形设置选项
  • url什么意思啊了
  • win7开机zyufs7
  • 动画时期
  • 实例讲解命局与大运流年作用
  • ExtJS 2.0实用简明教程之应用ExtJS
  • unity 3d脚本编程
  • python元数据
  • shell 查找文件并赋值shell变量
  • python黑魔法手册
  • python极简讲义pdf
  • javascript中checkbox使用方法简单实例演示
  • 对python变量的理解
  • 环保税新政策
  • 进口柴油消费税是多少
  • 2020年残保金申报截止到什么时间
  • 小规模纳税人需要进项票吗
  • 增值税可以抵扣多少
  • 河南电子税务局电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设