位置: IT常识 - 正文

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

编辑:rootadmin
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)

推荐整理分享YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov2改进,yolov5能从哪些方面改进,yolov3 改进,yolov5 改进,yolov3改进算法,yolov3 改进,yolov5 改进,yolov3 改进,内容如对您有帮助,希望把文章链接给更多的朋友!

 ​前 言:作为当前先进的深度学习目标检测算法YOLOv7,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv7的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7,YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

解决问题:YOLOv7主干特征提取网络为CNN网络,CNN具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构,充分两者的优点,提高目标检测效果,本人经过实验,对小目标以及密集预测任务会有一定的提升效果。视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。Transformer方法融合参考YOLOv5改进往期。

YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers_人工智能算法研究院的博客-CSDN博客

原理:

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

论文:https://arxiv.org/pdf/2207.14284.pdf

代码:GitHub - raoyongming/HorNet: HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

视觉变形金刚的最新进展在各种任务中都取得了巨大的成功由基于点积自注意力的新空间建模机制驱动。在本文中,我们展示了愿景变形金刚背后的关键要素,即输入自适应、长程和高阶空间交互,也可以使用基于卷积的框架有效地实现。我们提出递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新的操作高度灵活可定制,兼容各种卷积变体并将 self-attention 中的二阶交互扩​​展到任意阶,而无需引入大量额外的计算。 GnConv 可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族 命名为 HorNet。 ImageNet分类、COCO对象的大量实验检测和 ADE20K 语义分割显示 HorNet 优于 Swin Transformers 和 ConvNeXt 具有相似的整体架构和训练配置。 HorNet 还显示出良好的可扩展性更多的训练数据和更大的模型大小。除了视觉编码器的有效性之外,我们还展示了 gnConv 可以应用于特定任务的解码器和以更少的计算持续提高密集预测性能。我们的结果表明,gnConv 可以成为可视化建模的新基础模块它有效地结合了视觉 Transformer 和 CNN 的优点

 项目部分代码如下:

class gnconv(nn.Module): def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0): super().__init__() self.order = order self.dims = [dim // 2 ** i for i in range(order)] self.dims.reverse() self.proj_in = nn.Conv2d(dim, 2*dim, 1) if gflayer is None: self.dwconv = get_dwconv(sum(self.dims), 7, True) else: self.dwconv = gflayer(sum(self.dims), h=h, w=w) self.proj_out = nn.Conv2d(dim, dim, 1) self.pws = nn.ModuleList( [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)] ) self.scale = s print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

结 果:本人在多个数据集上做了大量实验,针对不同的数据集效果不同,涨点明显。

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:卷积的替换不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,希望能互粉一下,做个朋友,一起学习交流。

本文链接地址:https://www.jiuchutong.com/zhishi/297649.html 转载请保留说明!

上一篇:【实战与杂谈】如何复活一个开源网站-游戏王卡片生成器(实战到底究竟是什么意思啊)

下一篇:MySQL面试题-锁相关(数据库锁面试题)

  • 手机键盘背景图怎么设置

    手机键盘背景图怎么设置

  • 快手视频没声音是怎么回事(快手视频没声音怎么办)

    快手视频没声音是怎么回事(快手视频没声音怎么办)

  • 华为账号怎么解除实名认证(捡的手机关联华为账号怎么解)

    华为账号怎么解除实名认证(捡的手机关联华为账号怎么解)

  • 一淘邀请别人有什么奖励(一淘邀请好友有提成吗)

    一淘邀请别人有什么奖励(一淘邀请好友有提成吗)

  • 电脑波浪号怎么打(电脑波浪号怎么显示在中间)

    电脑波浪号怎么打(电脑波浪号怎么显示在中间)

  • 这个人不在激活状态什么意思(不在激活状态什么意思)

    这个人不在激活状态什么意思(不在激活状态什么意思)

  • 哔哩哔哩什么时候出来的(哔哩哔哩什么时候发视频看的人多)

    哔哩哔哩什么时候出来的(哔哩哔哩什么时候发视频看的人多)

  • 苹果两网和三网有什么区别(苹果两网三网是什么意思)

    苹果两网和三网有什么区别(苹果两网三网是什么意思)

  • 手机视频聊天发烫是什么原因(手机视频聊天发热是怎么回事)

    手机视频聊天发烫是什么原因(手机视频聊天发热是怎么回事)

  • 苹果x电池能用一天吗(苹果电池能换吗)

    苹果x电池能用一天吗(苹果电池能换吗)

  • 苹果手机提示灯怎么关(苹果手机提示灯一直闪怎么关)

    苹果手机提示灯怎么关(苹果手机提示灯一直闪怎么关)

  • 快手买不了东西怎么回事(快手买不了东西打不开怎么办)

    快手买不了东西怎么回事(快手买不了东西打不开怎么办)

  • 钉钉清空聊天记录后还能恢复吗(钉钉清空聊天记录在另一台设备登陆还有记录吗)

    钉钉清空聊天记录后还能恢复吗(钉钉清空聊天记录在另一台设备登陆还有记录吗)

  • 美团超时骑手有什么惩罚(美团超时骑手有什么惩罚 准时宝)

    美团超时骑手有什么惩罚(美团超时骑手有什么惩罚 准时宝)

  • 麒麟960s相当于骁龙多少(麒麟960 960s区别)

    麒麟960s相当于骁龙多少(麒麟960 960s区别)

  • 天气冷苹果手机耗电快怎么办(天气冷苹果手机耗电快)

    天气冷苹果手机耗电快怎么办(天气冷苹果手机耗电快)

  • 环绕声5.1ch什么意思(环绕声5.1ch怎么设置)

    环绕声5.1ch什么意思(环绕声5.1ch怎么设置)

  • 苹果六密码设置在哪里(苹果6手机密码设置)

    苹果六密码设置在哪里(苹果6手机密码设置)

  • 抖音怎么取消微信授权登录(抖音怎么取消微信绑定)

    抖音怎么取消微信授权登录(抖音怎么取消微信绑定)

  • 哔哩哔哩怎么上传音频(哔哩哔哩是什么东西)

    哔哩哔哩怎么上传音频(哔哩哔哩是什么东西)

  • 如何查看平板使用痕迹(如何查看平板使用痕迹华为)

    如何查看平板使用痕迹(如何查看平板使用痕迹华为)

  • 快手8484啥意思(快手上的4868什么意思)

    快手8484啥意思(快手上的4868什么意思)

  • 学信网怎么用邮箱找回密码(学信网怎么用邮箱改手机号)

    学信网怎么用邮箱找回密码(学信网怎么用邮箱改手机号)

  • 苹果手机章鱼输入法怎么用(苹果手机章鱼输入法怎么用不了)

    苹果手机章鱼输入法怎么用(苹果手机章鱼输入法怎么用不了)

  • 什么是关税自主权
  • 增值税专用发票怎么开
  • 运输服务属于生产劳务吗
  • 简易计税的增值税要计提附加税吗
  • 汇算清缴的
  • 应交税金借方余额代表什么
  • 资本公积转增股本个人所得税
  • 材料委托加工
  • 外商投资企业清算报告
  • 外汇结汇的方法有哪些呢?
  • 外币账户收款如何做账务处理呢?
  • 免税企业可以开具有税率的增值税专用发票吗
  • 增值税发票抵扣联丢失怎么办
  • 食品发票需要清关吗
  • 进项税借方有余额要怎么处理
  • 发票分票怎么处理违章
  • 出口退税计算方法是免退税吗
  • 货币资金包括哪些
  • c盘文件详解
  • 网页老是自己跳出来
  • linux计划任务crontab
  • win10重置此电脑的密码是什么
  • 个税申报的人数比工资表少了怎么办
  • win7玩什么游戏流畅
  • 已计提但未上缴税款
  • 收到税局退回增值税
  • Vue3+ElementPlus el-date-picker设置可选时间范围
  • 经营租赁的房屋计提折旧吗
  • 资产收购的账务处理办法
  • 基于php技术
  • 蒙特利尔 攻略
  • 踩雷日记:Pytorch mmcv-full简易安装
  • php resizeimage 部分jpg文件 生成缩略图失败的原因分析及解决办法
  • thinkphp5.0框架
  • 微信php源码
  • 增值税专用发票和普通发票的区别
  • 帝国cms手机模板是什么
  • 科技型中小企业查询
  • 资本公积的项目有哪些
  • 应付职工薪酬期末余额是什么意思
  • 单位购图书怎么入账
  • 自然人股东原价转让股权
  • sql函数coalesce
  • 加计抵减的其他收益免税吗
  • 修改数据库为多个数据
  • 银行存款余额调节表编制
  • 火车票报销抵扣比例是多少
  • 疫情期间增值税减免政策截止时间
  • 借别人钱收据怎么写
  • 退税政策调整
  • 股东投入的资金在现金流量表中如何提现
  • 挂靠人员社保缴费分录如何做?
  • 工程没钱也没有工资
  • 简易计税转出
  • 动物园会计核算办法
  • mysql优化十大技巧
  • WINDOWS操作系统内置的GUEST
  • Win7 64位旗舰版系统打开应用程序提示“发生未知的软件异常0xc06d007e”的解决方法
  • Windows Server 2008搭建终端服务器
  • 电脑自建热点
  • mentohust配置
  • ubuntu命令行打开火狐浏览器
  • dwm.exe占用内存过高怎么办
  • dae是什么文件
  • 如何在ubuntu上安装软件
  • win7系统的word文档中的工具在哪里
  • win10闹钟软件
  • windows8怎么设置
  • virtualbox怎么打开虚拟机
  • cocos2dx怎么打开
  • linux怎么调用python
  • javascript第二章上机怎么写
  • jquery下拉列表框
  • jquery获取当前日期yyyymmdd
  • 陈列费发票能抵扣吗
  • 税控机怎么开发票
  • 大连市网上税务申报平台
  • 政府给予补贴
  • 契税纳税申报表在哪里拿
  • 昱铭这个公司名字怎么样
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设