位置: IT常识 - 正文

【YOLOv7】主要改进点详解(yolov4参数设置)

编辑:rootadmin
【YOLOv7】主要改进点详解 文章目录YOLOv7介绍整体网络架构高效聚合网络重参数化卷积辅助头检测动态标签分配总结YOLOv7介绍

推荐整理分享【YOLOv7】主要改进点详解(yolov4参数设置),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolo v5改进,yolov5改进bifpn,yolov2改进,yolov2改进,yolov5改进bifpn,yolov3怎么改进,yolov3怎么改进,yolov5怎么改进,内容如对您有帮助,希望把文章链接给更多的朋友!

YOLOv7论文在上个月6号挂在了Arxiv上之后,引起了巨大轰动,短短一个月的时间,Github上就有了4.3k个Star。

从论文题目可以看出来,YOLOv7又是一个集大成者的杰作;从Github源码可以看出, 整体结构与YOLOv5极其相似,因此有YOLOov5基础的小伙伴可以无脑上手v7。

另外来看下v7的两位大牛作者,一作是 Chien-Yao Wang,近几年一直耕耘在目标检测领域,尤其是YOLO系列,代表作:YOLOv7、YOLOR、ScaledYOLOv4、CSPNet等。二作是 Alexey Bochkovskiy,就是在20年Joseph Redmon宣布退出CV领域后扛起YOLO系列大旗并发布YOLOv4的那位大神。  

整体网络架构

YOLOv7完整网络架构以及各组件的详细解析可以移步至:【YOLOv7_0.1】网络结构与源码解析,这里从另一个角度来了解YOLOov7的网络架构:

上面这张图是根据我目前的理解,对YOLOv7的整体结构进行的拆分,可能会有不正确的地方,欢迎各位小伙伴前来交流~

可以很清楚的看到,YOLOv7大部分继承自YOLOv5,包括整体网络架构、配置文件的设置和训练、推理、验证过程等等,基本上熟悉v5就可以无脑上手v7了;此外,v7也有不少继承自YOLOR,毕竟是同一个作者前后年的工作,包括不同网络的设计、超参数设置以及隐性知识学习的加入;还有就是在正样本匹配时仿照了YOLOX的SimOTA策略。

除了这些在已有YOLO版本中的算法之外,YOLOv7还包括了近几年最新的trick:高效聚合网络(目前论文还未接收)、重参数化卷积、辅助头检测、模型缩放等等,因此学习YOLOv7还是非常有价值的。  

高效聚合网络

图a和图b是之前常用的特征提取网络,图c则是YOLOv7主要用到的ELAN网络,虽然有引文,但是并没有任何详细资料来学习,对此,作者是这么说的:

ELAN paper will be released after accept at the latest.

好叭,那就再等等。图d是对ELAN的改进,其等效网络就是下面这个,也就是两个ELAN(红框里)的Concat,作者的解释是:

For E-ELAN architecture, since our edge device do not support group convolution and shuffle operation, we are forced to implement it as an equivalence architecture.

【YOLOv7】主要改进点详解(yolov4参数设置)

重参数化卷积

重参数化的作用:在保证模型性能的条件下加速网络,主要是对卷积+BN层以及不同卷积进行融合,合并为一个卷积模块。

下面给出了卷积+BN融合的公式化过程,红色表示卷积参数(权重和偏置),蓝色是BN参数(mmm是输入均值,vvv是输入标准差,γ\gammaγ和β\betaβ是两个可学习的参数),最终经过一系列化简,融合成了一个卷积:

在YOLOv7中,除了网络最后使用RepConv重参数化卷积之外,作者也提到了其他三处使用重参数化技巧的地方:

we perform reparameterization on conv-bn, repconv, orepa, and yolor.

对应model/yolo.py中model类的fuse函数(这里):

辅助头检测

YOLOv7中,将head部分的浅层特征提取出来作为Aux head(辅助头),深层特征也就是网络的最终输出作为Lead head(引导头),如图b所示。

在计算损失时:

图c的策略是,lead head和aux head分别、单独计算损失,最终相加图d的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本作为自己的正样本,并计算损失,最终相加(占比不同)图e的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本(这里是粗匹配,也就是选择GT框中心点所在网格的上下左右4个邻域网络作为正样本筛选区域)作为自己的正样本,并计算损失,最终相加(占比不同)

以training/yolov7-w6.yaml为例,最后detect模块的前四层为lead head,后四层为aux head,在推理时,只取前四层作为detect层的输出:

动态标签分配

YOLOv7的标签分配策略(正样本筛选),集成了YOLOv5和YOLOX两者的精华:

YOLOv5 Step1:Autoanchor策略,获得数据集最佳匹配的9个anchor(可选) Step2:根据GT框与anchor的宽高比,过滤掉不合适的anchor Step3:选择GT框的中心网格以及最邻近的2个邻域网格作为正样本筛选区域(辅助头则选择周围4个邻域网格)

YOLOX Step4:计算GT框与正样本IOU并从大到小排序,选取前10个值进行求和(P6前20个),并取整作为当前GT框的K值 Step5:根据损失函数计算每个GT框和候选anchor的损失,保留损失最小的前K个 Step6:去掉同一个anchor被分配到多个GT框的情况总结

概括:

YOLOv7在5FPS到160FPS的范围内,无论是速度或是精度,都超过了目前已知的检测器在V100上进行测试, 精度为56.8%AP的模型可达到30FPS(batch=1)以上的检测速率目前唯一一款在如此高精度下仍能超过30FPS的检测器

不足:

代码冗余,版本更新问题精度虚高(参考:如何评价AlexeyAB版的YOLOv7?)验证时数据预处理的图像缩放异常(没有做padding操作)验证时的NMS异常(应该是multi_label = False)

参考资料 目标检测算法——YOLOV7——详解 如何评价AlexeyAB版的YOLOv7?

本文链接地址:https://www.jiuchutong.com/zhishi/298384.html 转载请保留说明!

上一篇:R数据分析:临床预测模型中校准曲线和DCA曲线的意义与做法(r在数据分析中表示什么意思)

下一篇:查询数据库空间(mysql和oracle)(如何查询数据库表空间)

  • 如何查别人拉黑了我(怎么查别人把你拉黑名单)

    如何查别人拉黑了我(怎么查别人把你拉黑名单)

  • 小恩爱能查和前任的记录吗(小恩爱可以找回记录吗)

    小恩爱能查和前任的记录吗(小恩爱可以找回记录吗)

  • 手机号停机了怎么登录爱奇艺(手机号停机了怎么查号码)

    手机号停机了怎么登录爱奇艺(手机号停机了怎么查号码)

  • 荣耀手机开性能模式好吗(荣耀手机开性能模式对手机有伤害吗?)

    荣耀手机开性能模式好吗(荣耀手机开性能模式对手机有伤害吗?)

  • 荣耀9x如何开启畅连通话(荣耀9x如何开启语音助手)

    荣耀9x如何开启畅连通话(荣耀9x如何开启语音助手)

  • 访问空间是什么意思(访问空间啥意思)

    访问空间是什么意思(访问空间啥意思)

  • 阿里dns多少(阿里dns是多少啊)

    阿里dns多少(阿里dns是多少啊)

  • 查看本地的ip与dns在哪个模块中(本地ip怎么看)

    查看本地的ip与dns在哪个模块中(本地ip怎么看)

  • 通话结束是对方挂断吗(通话结束对方不挂电话)

    通话结束是对方挂断吗(通话结束对方不挂电话)

  • airpods丢了一只能配吗(airpods丢了一只怎么找回来)

    airpods丢了一只能配吗(airpods丢了一只怎么找回来)

  • 支付宝集五福能开几次(支付宝集五福能合成几个)

    支付宝集五福能开几次(支付宝集五福能合成几个)

  • 微信怎么同时在手机和平板上登录

    微信怎么同时在手机和平板上登录

  • 快手昵称后面的数字代表什么意思(快手昵称后面的星)

    快手昵称后面的数字代表什么意思(快手昵称后面的星)

  • 手机屏幕刷新率什么意思(手机屏幕刷新率60hz够用吗)

    手机屏幕刷新率什么意思(手机屏幕刷新率60hz够用吗)

  • 爱奇艺会员连续包月可以随时取消吗(爱奇艺会员连续包月只开一个月)

    爱奇艺会员连续包月可以随时取消吗(爱奇艺会员连续包月只开一个月)

  • 如何打印稿纸(a3纸如何打印成a4)

    如何打印稿纸(a3纸如何打印成a4)

  • 1个大气压等于多少psi(1个大气压等于多少公斤压力)

    1个大气压等于多少psi(1个大气压等于多少公斤压力)

  • 怎么删除腾讯充值记录(怎么删除腾讯充值中心交易记录)

    怎么删除腾讯充值记录(怎么删除腾讯充值中心交易记录)

  • 互联网+是什么(互联网是什么时候诞生的)

    互联网+是什么(互联网是什么时候诞生的)

  • 乐视手机在文件夹误删如何恢复(乐视手机文件管理在哪)

    乐视手机在文件夹误删如何恢复(乐视手机文件管理在哪)

  • soul头像上有个绿点是什么意思(soul头像上有个生日帽)

    soul头像上有个绿点是什么意思(soul头像上有个生日帽)

  • 爱维宝贝可以两个手机一起登录吗(爱维宝贝可以两个人用吗)

    爱维宝贝可以两个手机一起登录吗(爱维宝贝可以两个人用吗)

  • 俄勒冈海岸佩蓓角的雷神之井 (© Cavan Images/Offset by Shutterstock)(俄勒冈zip)

    俄勒冈海岸佩蓓角的雷神之井 (© Cavan Images/Offset by Shutterstock)(俄勒冈zip)

  • python多线程线程锁如何使用(python 多线程处理)

    python多线程线程锁如何使用(python 多线程处理)

  • python idle 是什么(python里的idle在哪)

    python idle 是什么(python里的idle在哪)

  • 年末暂估成本是否进行纳税调整处理
  • 公司从业人员包括老板吗
  • 资产负债表期末数是本年累计数吗
  • 劳务公司涉及的税收
  • 经常做无票收入没有通过公户收款会有问题吗
  • 库存商品赠送给客户要开票吗
  • 资产负债表存货为负数原因
  • 权益法下股权投资
  • 变更法人流程具体流程图
  • 取得拍卖的固定资产
  • 劳务费税收分类是什么
  • 商标转让增值税税目
  • 房产交易会涉及哪些费用
  • 残保金补报
  • 福利费提取后未使用能否税前扣除?
  • 供应商赠送
  • 我的初级备考经验怎么写
  • 股权投资涉税问题
  • 当月未抵扣进项税在进项税额明细表怎么填
  • 所得税汇算清缴退税会计分录怎么做
  • win11资源管理器卡死
  • 买点肥料
  • 七喜v8笔记本
  • 暂估入账收入会计分录
  • 清除cmos数据按钮一直亮
  • 进货的折扣该怎么算
  • PQV2ISECURITY.EXE - PQV2ISECURITY是什么进程 有什么用
  • oawrapper.exe是什么
  • 房产开发企业交房产税吗
  • 装饰工程施工包括什么
  • postman汉化包
  • Symfony2中被遗弃的getRequest()方法分析
  • 建筑公司算不算企业
  • php生成csv文件
  • 使用一个for循环每次输入一个姓名和得分
  • 购买原材料产生的费用
  • vue 可拖拽
  • 前端vue面试题2020
  • flask框架入门
  • php生成唯一字符串
  • update命令怎么用
  • Blog2N如何计算
  • 资产减值损失一经计提不得转回
  • 售后租回怎么理解
  • poi java 导入导出
  • 货物不符合质量条款规定
  • 工资是负数怎么办
  • 进项加计抵减对账怎么做
  • 物流费用怎么算一般多少
  • 工商年报纳税总额包括滞纳金吗
  • 购买方收到的违约金
  • 企业弥补以前年度亏损要怎么填表
  • 消费税纳税人的具体纳税期限由主管税务机关
  • 哪些拍卖行为不属于诈骗
  • 跨年银行回单怎么入账
  • 如何冲销应付账款
  • 销售款退回会计分录
  • 平销返利销项税
  • 非限定性净资产是什么意思
  • 没有发票的福利费支出可以税前扣除吗
  • 要约收购期满
  • 帮员工代缴社保分录怎么办
  • 银行回单借贷标志贷表示什么
  • 私营公司固定资产怎么查
  • pd虚拟机安装安卓系统
  • win8.1的开始菜单在哪
  • 苹果mac系统复制粘贴不了
  • linux ping命令的用法
  • win10系统无法运行海岛大亨5
  • linux用什么版本
  • jquery获取本地ip
  • ExtJs 3.1 XmlTreeLoader Example Error
  • perl 获取数据库查询结果
  • 不易引起无意注意的是
  • bash 删除文件夹
  • 可视化gradcam
  • javascript的描述
  • js控制并发数
  • Android的事件处理机制是一种______机制
  • 北京市生育津贴发放标准
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设