位置: IT常识 - 正文

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

编辑:rootadmin
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)

推荐整理分享YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov2改进,yolov5能从哪些方面改进,yolov3 改进,yolov5 改进,yolov3改进算法,yolov3 改进,yolov5 改进,yolov3 改进,内容如对您有帮助,希望把文章链接给更多的朋友!

 ​前 言:作为当前先进的深度学习目标检测算法YOLOv7,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv7的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7,YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

解决问题:YOLOv7主干特征提取网络为CNN网络,CNN具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构,充分两者的优点,提高目标检测效果,本人经过实验,对小目标以及密集预测任务会有一定的提升效果。视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。Transformer方法融合参考YOLOv5改进往期。

YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers_人工智能算法研究院的博客-CSDN博客

原理:

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

论文:https://arxiv.org/pdf/2207.14284.pdf

代码:GitHub - raoyongming/HorNet: HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

视觉变形金刚的最新进展在各种任务中都取得了巨大的成功由基于点积自注意力的新空间建模机制驱动。在本文中,我们展示了愿景变形金刚背后的关键要素,即输入自适应、长程和高阶空间交互,也可以使用基于卷积的框架有效地实现。我们提出递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新的操作高度灵活可定制,兼容各种卷积变体并将 self-attention 中的二阶交互扩​​展到任意阶,而无需引入大量额外的计算。 GnConv 可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族 命名为 HorNet。 ImageNet分类、COCO对象的大量实验检测和 ADE20K 语义分割显示 HorNet 优于 Swin Transformers 和 ConvNeXt 具有相似的整体架构和训练配置。 HorNet 还显示出良好的可扩展性更多的训练数据和更大的模型大小。除了视觉编码器的有效性之外,我们还展示了 gnConv 可以应用于特定任务的解码器和以更少的计算持续提高密集预测性能。我们的结果表明,gnConv 可以成为可视化建模的新基础模块它有效地结合了视觉 Transformer 和 CNN 的优点

 项目部分代码如下:

class gnconv(nn.Module): def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0): super().__init__() self.order = order self.dims = [dim // 2 ** i for i in range(order)] self.dims.reverse() self.proj_in = nn.Conv2d(dim, 2*dim, 1) if gflayer is None: self.dwconv = get_dwconv(sum(self.dims), 7, True) else: self.dwconv = gflayer(sum(self.dims), h=h, w=w) self.proj_out = nn.Conv2d(dim, dim, 1) self.pws = nn.ModuleList( [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)] ) self.scale = s print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

结 果:本人在多个数据集上做了大量实验,针对不同的数据集效果不同,涨点明显。

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:卷积的替换不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,希望能互粉一下,做个朋友,一起学习交流。

本文链接地址:https://www.jiuchutong.com/zhishi/297649.html 转载请保留说明!

上一篇:【实战与杂谈】如何复活一个开源网站-游戏王卡片生成器(实战到底究竟是什么意思啊)

下一篇:MySQL面试题-锁相关(数据库锁面试题)

  • 金融行业网络营销的几种方法(金融行业网络营销策略)

    金融行业网络营销的几种方法(金融行业网络营销策略)

  • 华为荣耀8手机通话音量小怎么办(华为荣耀8手机,耳机好的但是插了还是外放)

    华为荣耀8手机通话音量小怎么办(华为荣耀8手机,耳机好的但是插了还是外放)

  • 微信怎么看聊天记录时间(微信怎么看聊天记录多少条)

    微信怎么看聊天记录时间(微信怎么看聊天记录多少条)

  • 千兆光猫配什么路由器(千兆光猫选择)

    千兆光猫配什么路由器(千兆光猫选择)

  • 三星s8充电功率(三星s8充电功率多少)

    三星s8充电功率(三星s8充电功率多少)

  • 荣耀8x支持内存卡吗(荣耀8x内存扩展教程)

    荣耀8x支持内存卡吗(荣耀8x内存扩展教程)

  • 亲情守护设备离线是什么意思(亲情守护结束运行会怎么样)

    亲情守护设备离线是什么意思(亲情守护结束运行会怎么样)

  • 设备和打印机不显示打印机(设备和打印机不显示扫描功能)

    设备和打印机不显示打印机(设备和打印机不显示扫描功能)

  • 苹果手机拍视频没声音(苹果手机拍视频怎么把音乐录进去)

    苹果手机拍视频没声音(苹果手机拍视频怎么把音乐录进去)

  • 支付宝扫码支付怎么找到对方(支付宝扫码支付最大额度)

    支付宝扫码支付怎么找到对方(支付宝扫码支付最大额度)

  • 笔记本很慢很卡怎么办(笔记本很慢很卡什么原因)

    笔记本很慢很卡怎么办(笔记本很慢很卡什么原因)

  • 抖音极速版绑定支付宝安全吗(抖音极速版绑定异常怎么回事)

    抖音极速版绑定支付宝安全吗(抖音极速版绑定异常怎么回事)

  • 有什么软件可以直播(有什么软件可以识别图片的文字)

    有什么软件可以直播(有什么软件可以识别图片的文字)

  • 苹果11怎么设置信任软件(苹果11怎么设置5g网络)

    苹果11怎么设置信任软件(苹果11怎么设置5g网络)

  • 书旗小说自动续费怎么关(书旗小说自动扣费怎么关闭)

    书旗小说自动续费怎么关(书旗小说自动扣费怎么关闭)

  • 苹果x后置呼吸灯怎么设置(iphonex后置)

    苹果x后置呼吸灯怎么设置(iphonex后置)

  • 在拼多多收货有货号吗(拼多多收货有价格吗)

    在拼多多收货有货号吗(拼多多收货有价格吗)

  • 华为type-c手机有哪些(华为typec手机有哪几种)

    华为type-c手机有哪些(华为typec手机有哪几种)

  • oppok1关机键在哪里(oppo k5关机键)

    oppok1关机键在哪里(oppo k5关机键)

  • 电脑耳机声音小怎么办(电脑耳机声音小怎么回事)

    电脑耳机声音小怎么办(电脑耳机声音小怎么回事)

  • iqoo充电孔能不能插耳机(iqoo充电口图)

    iqoo充电孔能不能插耳机(iqoo充电口图)

  • 抖音收藏音乐怎么保存到手机(抖音收藏音乐怎么转到u盘)

    抖音收藏音乐怎么保存到手机(抖音收藏音乐怎么转到u盘)

  • vivox9puls有没有nfc功能(vivox9splus有nfc)

    vivox9puls有没有nfc功能(vivox9splus有nfc)

  • qq帆船是两个人都有吗(qq的帆船是双方显示还是单方也能显示)

    qq帆船是两个人都有吗(qq的帆船是双方显示还是单方也能显示)

  • mrp mrp2 erp区别(mrp2和erp的区别)

    mrp mrp2 erp区别(mrp2和erp的区别)

  • 一种使用Java的快速将Web中表格转换成Excel的方法(在java中有一种叫做)

    一种使用Java的快速将Web中表格转换成Excel的方法(在java中有一种叫做)

  • antd pro 使用心得(antd pro v5)

    antd pro 使用心得(antd pro v5)

  • 北京增值税发票查验平台
  • 企业所得税退税的会计分录怎么做
  • 纳税调整项目包括哪些?请简单列举
  • 企业的免税收入用于支出所形成的费用
  • 补缴以前年度增值税如何做账
  • 个人所得税专项扣除子女教育标准
  • 当月费用次月收到发票
  • 佣金开什么发票
  • 印花税2021年需要计提吗
  • 滞纳金海关
  • 产品税率下调企业是否要到税务部门备案
  • 发放货物给员工 赠送
  • 可抵扣农产品进项税额吗
  • 跨年发票是否可以报销 审计
  • 现金短缺溢余求借多少短期借款?
  • 逾期认证未抵扣的文件
  • 收到保险公司返还的保险费
  • 钱汇错需要退回应该怎么做分录?
  • 施工企业直接费间接费怎么算
  • 小规模纳税人提供设计服务税率
  • 喷绘制作费的税率
  • 营改增试点实施办法的法律层次是
  • 机打发票领回怎么录入
  • 如何查询以前申诉进度
  • 小规模纳税人怎么算税
  • 补充养老保险计算器
  • 个税申报需要补税是什么情况
  • 建筑设计公司的账务处理
  • 怎么授权gg修改器root权限
  • 会计报表申报期限怎么填
  • 如何查询公司有没有报个税
  • 商场收取租金要缴纳哪些税
  • php中this的用法
  • 饭店开业请客说什么
  • macwifi配置
  • win8换成win7重装系统
  • 应交增值税的完整计算公式是什么
  • 材料发票入账
  • 应付职工薪酬怎么做记账凭证
  • 密歇根湖怎么读
  • 企业信用贷款还款方式
  • php如何调用类
  • php静态页面生成
  • php三级分销思路
  • 预付装修费的会计处理分录
  • 阿里云盘 icloud
  • Python web开发基础教程的心得
  • ping命令可以用来测试什么
  • 房地产代理公司资质证书
  • mysql分区实现
  • 借入资金会计科目
  • 如何简单去除
  • 福利费要分部门吗
  • 当月收入可以下月开票吗
  • 税务信用级别A有什么好处
  • 备案办税人员信息是谁
  • 其他应付款冲账分录
  • 工会经费记在什么科目
  • 应收账款的客户如何分析
  • 代扣代缴的增值税额
  • 将外购商品作为非货币
  • 加计扣除是指什么意思
  • 建筑业当月有收入,没成本怎样办
  • 待处理财产损益的账务处理
  • 材料采购办法
  • 收到发票没付款,能打赢官司吗
  • 转账支票有效期6个月
  • mysql 正则表达式分组替换
  • ubuntu必备软件10款
  • win7界面比win10好看
  • win8.1使用技巧大全
  • 解决Android Studio下载gradle慢
  • Python自然语言处理PDF
  • android 基础
  • linuxtop命令详解
  • javascript高级程序设计pdf百度云
  • js中判断
  • js判断网页链接是否可用
  • 税务局约谈记录
  • 福建省税务局 电子
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设