位置: IT常识 - 正文

涨点技巧:注意力机制---Yolov8引入CBAM、GAM、Resnet_CBAM(涨点是什么意思)

编辑:rootadmin
涨点技巧:注意力机制---Yolov8引入CBAM、GAM、Resnet_CBAM  1.计算机视觉中的注意力机制

推荐整理分享涨点技巧:注意力机制---Yolov8引入CBAM、GAM、Resnet_CBAM(涨点是什么意思),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:股市涨点是什么意思,股票涨点什么意思,股票涨点什么意思,起涨点买入法,涨点怎么计算,涨点是什么意思,抓住股票起涨点,股票涨点,内容如对您有帮助,希望把文章链接给更多的朋友!

一般来说,注意力机制通常被分为以下基本四大类:

通道注意力 Channel Attention

空间注意力机制 Spatial Attention

时间注意力机制 Temporal Attention

分支注意力机制 Branch Attention

1.1.CBAM:通道注意力和空间注意力的集成者

轻量级的卷积注意力模块,它结合了通道和空间的注意力机制模块

论文题目:《CBAM: Convolutional Block Attention Module》 论文地址:  https://arxiv.org/pdf/1807.06521.pdf

上图可以看到,CBAM包含CAM(Channel Attention Module)和SAM(Spartial Attention Module)两个子模块,分别进行通道和空间上的Attention。这样不只能够节约参数和计算力,并且保证了其能够做为即插即用的模块集成到现有的网络架构中去。

1.2 GAM:Global Attention Mechanism涨点技巧:注意力机制---Yolov8引入CBAM、GAM、Resnet_CBAM(涨点是什么意思)

超越CBAM,全新注意力GAM:不计成本提高精度! 论文题目:Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions 论文地址:https://paperswithcode.com/paper/global-attention-mechanism-retain-information

从整体上可以看出,GAM和CBAM注意力机制还是比较相似的,同样是使用了通道注意力机制和空间注意力机制。但是不同的是对通道注意力和空间注意力的处理。​

1.3 ResBlock_CBAM

CBAM结构其实就是将通道注意力信息核空间注意力信息在一个block结构中进行运用。

在resnet中实现cbam:即在原始block和残差结构连接前,依次通过channel attention和spatial attention即可。

1.4性能评价

 2.Yolov8加入CBAM、GAM

2.1 CBAM加入modules.py中(相当于yolov5中的common.py)class ChannelAttention(nn.Module): # Channel-attention module https://github.com/open-mmlab/mmdetection/tree/v3.0.0rc1/configs/rtmdet def __init__(self, channels: int) -> None: super().__init__() self.pool = nn.AdaptiveAvgPool2d(1) self.fc = nn.Conv2d(channels, channels, 1, 1, 0, bias=True) self.act = nn.Sigmoid() def forward(self, x: torch.Tensor) -> torch.Tensor: return x * self.act(self.fc(self.pool(x)))class SpatialAttention(nn.Module): # Spatial-attention module def __init__(self, kernel_size=7): super().__init__() assert kernel_size in (3, 7), 'kernel size must be 3 or 7' padding = 3 if kernel_size == 7 else 1 self.cv1 = nn.Conv2d(2, 1, kernel_size, padding=padding, bias=False) self.act = nn.Sigmoid() def forward(self, x): return x * self.act(self.cv1(torch.cat([torch.mean(x, 1, keepdim=True), torch.max(x, 1, keepdim=True)[0]], 1)))class CBAM(nn.Module): # Convolutional Block Attention Module def __init__(self, c1, kernel_size=7): # ch_in, kernels super().__init__() self.channel_attention = ChannelAttention(c1) self.spatial_attention = SpatialAttention(kernel_size) def forward(self, x): return self.spatial_attention(self.channel_attention(x))

2.2 GAM_Attention加入modules.py中:

def channel_shuffle(x, groups=2): ##shuffle channel # RESHAPE----->transpose------->Flatten B, C, H, W = x.size() out = x.view(B, groups, C // groups, H, W).permute(0, 2, 1, 3, 4).contiguous() out = out.view(B, C, H, W) return outclass GAM_Attention(nn.Module): # https://paperswithcode.com/paper/global-attention-mechanism-retain-information def __init__(self, c1, c2, group=True, rate=4): super(GAM_Attention, self).__init__() self.channel_attention = nn.Sequential( nn.Linear(c1, int(c1 / rate)), nn.ReLU(inplace=True), nn.Linear(int(c1 / rate), c1) ) self.spatial_attention = nn.Sequential( nn.Conv2d(c1, c1 // rate, kernel_size=7, padding=3, groups=rate) if group else nn.Conv2d(c1, int(c1 / rate), kernel_size=7, padding=3), nn.BatchNorm2d(int(c1 / rate)), nn.ReLU(inplace=True), nn.Conv2d(c1 // rate, c2, kernel_size=7, padding=3, groups=rate) if group else nn.Conv2d(int(c1 / rate), c2, kernel_size=7, padding=3), nn.BatchNorm2d(c2) ) def forward(self, x): b, c, h, w = x.shape x_permute = x.permute(0, 2, 3, 1).view(b, -1, c) x_att_permute = self.channel_attention(x_permute).view(b, h, w, c) x_channel_att = x_att_permute.permute(0, 3, 1, 2) # x_channel_att=channel_shuffle(x_channel_att,4) #last shuffle x = x * x_channel_att x_spatial_att = self.spatial_attention(x).sigmoid() x_spatial_att = channel_shuffle(x_spatial_att, 4) # last shuffle out = x * x_spatial_att # out=channel_shuffle(out,4) #last shuffle return out

2.3 ResBlock_CBAM加入modules.py中:

class ResBlock_CBAM(nn.Module): def __init__(self, in_places, places, stride=1, downsampling=False, expansion=4): super(ResBlock_CBAM, self).__init__() self.expansion = expansion self.downsampling = downsampling self.bottleneck = nn.Sequential( nn.Conv2d(in_channels=in_places, out_channels=places, kernel_size=1, stride=1, bias=False), nn.BatchNorm2d(places), nn.LeakyReLU(0.1, inplace=True), nn.Conv2d(in_channels=places, out_channels=places, kernel_size=3, stride=stride, padding=1, bias=False), nn.BatchNorm2d(places), nn.LeakyReLU(0.1, inplace=True), nn.Conv2d(in_channels=places, out_channels=places * self.expansion, kernel_size=1, stride=1, bias=False), nn.BatchNorm2d(places * self.expansion), ) self.cbam = CBAM(c1=places * self.expansion, c2=places * self.expansion, ) if self.downsampling: self.downsample = nn.Sequential( nn.Conv2d(in_channels=in_places, out_channels=places * self.expansion, kernel_size=1, stride=stride, bias=False), nn.BatchNorm2d(places * self.expansion) ) self.relu = nn.ReLU(inplace=True) def forward(self, x): residual = x out = self.bottleneck(x) out = self.cbam(out) if self.downsampling: residual = self.downsample(x) out += residual out = self.relu(out) return out

2.4 CBAM、GAM_Attention、ResBlock_CBAM加入tasks.py中(相当于yolov5中的yolo.py)

from ultralytics.nn.modules import (C1, C2, C3, C3TR, SPP, SPPF, Bottleneck, BottleneckCSP, C2f, C3Ghost, C3x, Classify, Concat, Conv, ConvTranspose, Detect, DWConv, DWConvTranspose2d, Ensemble, Focus, GhostBottleneck, GhostConv, Segment,CBAM, GAM_Attention , ResBlock_CBAM)

def parse_model(d, ch, verbose=True):函数中

if m in (Classify, Conv, ConvTranspose, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, Focus, BottleneckCSP, C1, C2, C2f, C3, C3TR, C3Ghost, nn.ConvTranspose2d, DWConvTranspose2d, C3x , CBAM , GAM_Attention ,ResBlock_CBAM):

2.4 CBAM、GAM修改对应yaml

2.4.1 CBAM加入yolov8

# Ultralytics YOLO 🚀, GPL-3.0 license# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect# Parametersnc: 80 # number of classesscales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n' # [depth, width, max_channels] n: [0.33, 0.25, 1024] # YOLOv8n summary: 225 layers, 3157200 parameters, 3157184 gradients, 8.9 GFLOPs s: [0.33, 0.50, 1024] # YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients, 28.8 GFLOPs m: [0.67, 0.75, 768] # YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients, 79.3 GFLOPs l: [1.00, 1.00, 512] # YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPs x: [1.00, 1.25, 512] # YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs# YOLOv8.0n backbonebackbone: # [from, repeats, module, args] - [-1, 1, Conv, [64, 3, 2]] # 0-P1/2 - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4 - [-1, 3, C2f, [128, True]] - [-1, 1, Conv, [256, 3, 2]] # 3-P3/8 - [-1, 6, C2f, [256, True]] - [-1, 1, Conv, [512, 3, 2]] # 5-P4/16 - [-1, 6, C2f, [512, True]] - [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32 - [-1, 3, C2f, [1024, True]] - [-1, 1, SPPF, [1024, 5]] # 9# YOLOv8.0n headhead: - [-1, 1, nn.Upsample, [None, 2, 'nearest']] - [[-1, 6], 1, Concat, [1]] # cat backbone P4 - [-1, 3, C2f, [512]] # 12 - [-1, 1, CBAM, [512]] - [-1, 1, nn.Upsample, [None, 2, 'nearest']] - [[-1, 4], 1, Concat, [1]] # cat backbone P3 - [-1, 3, C2f, [256]] # 16 (P3/8-small) - [-1, 1, CBAM, [256]] - [-1, 1, Conv, [256, 3, 2]] - [[-1, 13], 1, Concat, [1]] # cat head P4 - [-1, 3, C2f, [512]] # 20 (P4/16-medium) - [-1, 1, CBAM, [512]] - [-1, 1, Conv, [512, 3, 2]] - [[-1, 9], 1, Concat, [1]] # cat head P5 - [-1, 3, C2f, [1024]] # 24 (P5/32-large) - [-1, 1, CBAM, [1024]] - [[17, 21, 25], 1, Detect, [nc]] # Detect(P3, P4, P5)

2.4.2 GAM加入yolov8

# Ultralytics YOLO 🚀, GPL-3.0 license# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect# Parametersnc: 80 # number of classesscales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n' # [depth, width, max_channels] n: [0.33, 0.25, 1024] # YOLOv8n summary: 225 layers, 3157200 parameters, 3157184 gradients, 8.9 GFLOPs s: [0.33, 0.50, 1024] # YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients, 28.8 GFLOPs m: [0.67, 0.75, 768] # YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients, 79.3 GFLOPs l: [1.00, 1.00, 512] # YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPs x: [1.00, 1.25, 512] # YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs# YOLOv8.0n backbonebackbone: # [from, repeats, module, args] - [-1, 1, Conv, [64, 3, 2]] # 0-P1/2 - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4 - [-1, 3, C2f, [128, True]] - [-1, 1, Conv, [256, 3, 2]] # 3-P3/8 - [-1, 6, C2f, [256, True]] - [-1, 1, Conv, [512, 3, 2]] # 5-P4/16 - [-1, 6, C2f, [512, True]] - [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32 - [-1, 3, C2f, [1024, True]] - [-1, 1, SPPF, [1024, 5]] # 9# YOLOv8.0n headhead: - [-1, 1, nn.Upsample, [None, 2, 'nearest']] - [[-1, 6], 1, Concat, [1]] # cat backbone P4 - [-1, 3, C2f, [512]] # 12 - [-1, 1, GAM_Attention, [512,512]] - [-1, 1, nn.Upsample, [None, 2, 'nearest']] - [[-1, 4], 1, Concat, [1]] # cat backbone P3 - [-1, 3, C2f, [256]] # 16 (P3/8-small) - [-1, 1, GAM_Attention, [256,256]] - [-1, 1, Conv, [256, 3, 2]] - [[-1, 13], 1, Concat, [1]] # cat head P4 - [-1, 3, C2f, [512]] # 20 (P4/16-medium) - [-1, 1, GAM_Attention, [512,512]] - [-1, 1, Conv, [512, 3, 2]] - [[-1, 9], 1, Concat, [1]] # cat head P5 - [-1, 3, C2f, [1024]] # 24 (P5/32-large) - [-1, 1, GAM_Attention, [1024,1024]] - [[17, 21, 25], 1, Detect, [nc]] # Detect(P3, P4, P5)
本文链接地址:https://www.jiuchutong.com/zhishi/289679.html 转载请保留说明!

上一篇:最贵的微博是什么(史上最贵的微博)

下一篇:我找到了 4 个 Midjourney 的免费替代品,停止为 Midjourney 付费,有免费的 AI 替代品(我找到了这个)

  • 1688收藏店铺哪里找(1688收藏的店铺不见了)

    1688收藏店铺哪里找(1688收藏的店铺不见了)

  • 手机屏幕有重影但是可以正常使用(手机屏幕有重影怎么解决)

    手机屏幕有重影但是可以正常使用(手机屏幕有重影怎么解决)

  • 微信开视频可以美颜吗(微信开视频可以定位到对方的位置吗)

    微信开视频可以美颜吗(微信开视频可以定位到对方的位置吗)

  • 为什么电脑桌面图标变成白纸(为什么电脑桌面壁纸换不了)

    为什么电脑桌面图标变成白纸(为什么电脑桌面壁纸换不了)

  • 需要多处复制按哪个键(多处复制粘贴快捷键)

    需要多处复制按哪个键(多处复制粘贴快捷键)

  • 抖音下雨特效怎么制作(抖音特效下雨加图片视频)

    抖音下雨特效怎么制作(抖音特效下雨加图片视频)

  • airpods pro3怎么分辨真假(airpods pro怎么分几代)

    airpods pro3怎么分辨真假(airpods pro怎么分几代)

  • 淘宝店铺页面搬走了是什么意思(淘宝店铺页面搬运软件)

    淘宝店铺页面搬走了是什么意思(淘宝店铺页面搬运软件)

  • ipad a1599是什么机型(ipad a1599是ipad几)

    ipad a1599是什么机型(ipad a1599是ipad几)

  • 荣耀30闪存是2.1还是3.0(荣耀30的闪存是ufs多少)

    荣耀30闪存是2.1还是3.0(荣耀30的闪存是ufs多少)

  • 电脑锁住了怎么解锁(电脑锁住了怎么解)

    电脑锁住了怎么解锁(电脑锁住了怎么解)

  • 小米10青春版卡槽在哪里(小米10青春版卡槽孔是哪个)

    小米10青春版卡槽在哪里(小米10青春版卡槽孔是哪个)

  • 11 pro max是双卡吗(11promax是双卡手机吗)

    11 pro max是双卡吗(11promax是双卡手机吗)

  • 怎么把三个视频合成一个视频(怎么把三个视频做成三屏)

    怎么把三个视频合成一个视频(怎么把三个视频做成三屏)

  • 电脑的音响线是插在哪一个上面(电脑音响线是哪个孔)

    电脑的音响线是插在哪一个上面(电脑音响线是哪个孔)

  • 为什么抖音里面的收藏都没有了(为什么抖音里面都没有微信支付的弄不出来)

    为什么抖音里面的收藏都没有了(为什么抖音里面都没有微信支付的弄不出来)

  • 微信朋友圈怎么发空白消息(微信朋友圈怎么批量删除)

    微信朋友圈怎么发空白消息(微信朋友圈怎么批量删除)

  • 华为手机怎么给小艺改名(华为手机怎么给应用上锁)

    华为手机怎么给小艺改名(华为手机怎么给应用上锁)

  • 手机热点被蹭了怎么办(手机热点被人蹭)

    手机热点被蹭了怎么办(手机热点被人蹭)

  • 手机ip是什么(手机一键换ip)

    手机ip是什么(手机一键换ip)

  • 苹果11怎么关掉碰屏就亮(苹果11怎么关掉省电模式)

    苹果11怎么关掉碰屏就亮(苹果11怎么关掉省电模式)

  • 台积电和富士康是什么关系(台积电和富士康哪个牛)

    台积电和富士康是什么关系(台积电和富士康哪个牛)

  • 华为荣耀20i是快充吗(华为荣耀20i快充66W有什么后果吗)

    华为荣耀20i是快充吗(华为荣耀20i快充66W有什么后果吗)

  • 麒麟980采用了什么技术(麒麟980什么)

    麒麟980采用了什么技术(麒麟980什么)

  • 苹果5s如何录屏(苹果5s录屏在哪)

    苹果5s如何录屏(苹果5s录屏在哪)

  • 哈罗出行怎么付钱(哈罗出行付了钱,我能取消订单嘛)

    哈罗出行怎么付钱(哈罗出行付了钱,我能取消订单嘛)

  • Win11重置系统失败怎么办?Win11重置系统失败的解决方法(win11重置此电脑失败)

    Win11重置系统失败怎么办?Win11重置系统失败的解决方法(win11重置此电脑失败)

  • Linux编程时出现Segmentation fault错误如何解决?(linux运行后出现乱码)

    Linux编程时出现Segmentation fault错误如何解决?(linux运行后出现乱码)

  • 模式识别与图像处理课程实验一:图像处理实验(颜色算子实验、Susan、Harris角点检测实验、 sobel边缘算子检测实验)(模式识别与图像处理能做什么)

    模式识别与图像处理课程实验一:图像处理实验(颜色算子实验、Susan、Harris角点检测实验、 sobel边缘算子检测实验)(模式识别与图像处理能做什么)

  • 企业税收收入怎么计算
  • 个体工商户超过免税额度如何收税
  • 个人出租住房需要缴纳哪些税
  • 房地产开发商需要缴纳什么税
  • 关联企业往来款 利息
  • 未到期责任准备金24分法详解
  • 卖胶卷的店
  • 营改增是初次分配还是再分配
  • 优惠券抵扣账务处理流程
  • 销售货物的价外费用有哪些
  • 销售公司车辆如何填报销项税
  • 售后回租有风险吗
  • 事业单位退休人员独生子女费如何发放
  • 支付运费价税合计
  • 税务是如何处理违章的
  • 三证合一办完后的流程
  • 存货的计税价格是什么
  • 固定资产和在建工程占所有者权益的占比
  • 记账凭证和转账凭证可以装订在一起吗
  • 国外进口的食品还能吃吗
  • 关联公司代付款帐怎么做
  • 如何让解决中世纪基督教世界黑暗
  • 2020年预付卡增值税税收政策
  • 零售业收入
  • mac鼠标移动到角落立刻显示桌面
  • 既征收消费税又征收增值税的是
  • laravel 使用redis
  • 报废车怎么走流程
  • 库存现金盘盈影响营业利润吗
  • chatgpt的多种免费使用方式
  • css水平居中和垂直居中怎么设置
  • telnet 执行命令
  • 小规模建筑公司经营范围大全
  • 什么是零申报制度
  • 免税法扣除法抵免法的区别
  • 当月增加的固定资产当月不计提折旧
  • sqlserver2016使用方法
  • 工业设备种类
  • 土地出让合同的法律效力
  • sql 获取指定字符位置
  • 弥补亏损账务处理流程
  • 权益性投资收益确认收入时间
  • 预缴增值税需要提交什么资料
  • 购买的固定资产退货怎么做账
  • 普通发票冲红重开要多久
  • 专利权摊销如何计算
  • 航天信息全额抵扣分录
  • 开票未收到款会计分录
  • 提前报废固定资产需要补提折旧
  • 关于单独计价的规定
  • 开公司如何选择行业
  • 采购人员垫付怎么入账
  • 如何防止sql注入及数据安全问题
  • win7系统计算机管理功能打不开
  • win8系统如何安装软件
  • Win10怎么设置高性能
  • ubuntu的命令行快捷键
  • vc软件是什么软件
  • wget下载命令
  • linux tracker
  • win8系统如何关机
  • win10如何设置默认应用语言
  • linux查看rpm是否安装
  • win10怎么修改桌面图标样式
  • win安装ie8
  • Win10 Mobile 10586.164中文版升级截图曝光
  • linux系统怎么更改语言
  • 水下摄影技巧
  • ztree默认选中
  • 有关表格边框的快捷键
  • [置顶]公主大人接下来是拷问时间31
  • unity连接
  • unity 游戏保存
  • 使用JQuery中的trim()方法去掉前后空格
  • javascript常用类型
  • js面向对象是什么意思
  • 美国税务制度
  • 增值税普通发票需要交税吗
  • 手写发票属于增值税普通发票吗
  • 汽车票用什么查
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设