位置: IT常识 - 正文

注意力机制-CA注意力-Coordinate attention(注意力机制详解)

编辑:rootadmin
注意力机制-CA注意力-Coordinate attention 注意力机制学习--CA(Coordinate attention)简介CA注意力机制的优势:提出不足算法流程图代码最后简介

推荐整理分享注意力机制-CA注意力-Coordinate attention(注意力机制详解),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:注意力机制 cv,注意力机制 lstm,注意力机制 cv,注意力机制 cv,注意力机制 q k v,注意力机制 lstm,注意力机制cbam,注意力机制工作原理,内容如对您有帮助,希望把文章链接给更多的朋友!

CA(Coordinate attention for efficient mobile network design)发表在CVPR2021,帮助轻量级网络涨点、即插即用。

CA注意力机制的优势:注意力机制-CA注意力-Coordinate attention(注意力机制详解)

1、不仅考虑了通道信息,还考虑了方向相关的位置信息。 2、足够的灵活和轻量,能够简单的插入到轻量级网络的核心模块中。

提出不足

1、SE注意力中只关注构建通道之间的相互依赖关系,忽略了空间特征。 2、CBAM中引入了大尺度的卷积核提取空间特征,但忽略了长程依赖问题。

算法流程图

step1: 为了避免空间信息全部压缩到通道中,这里没有使用全局平均池化。为了能够捕获具有精准位置信息的远程空间交互,对全局平均池化进行的分解,具体如下: 对尺寸为C∗H∗WC*H*WC∗H∗W输入特征图InputInputInput分别按照XXX方向和YYY方向进行池化,分别生成尺寸为C∗H∗1C*H*1C∗H∗1和C∗1∗WC*1*WC∗1∗W的特征图。如下图所示(图片粘贴自B站大佬渣渣的熊猫潘)。 step2:将生成的C∗1∗WC*1*WC∗1∗W的特征图进行变换,然后进行concat操作。公式如下: 将zhz^hzh和zwz^wzw进行concat后生成如下图所示的特征图,然后进行F1操作(利用1*1卷积核进行降维,如SE注意力中操作)和激活操作,生成特征图f∈RC/r×(H+W)×1f \in \mathbb{R}^{C/r\times(H+W)\times1}f∈RC/r×(H+W)×1。 step3:沿着空间维度,再将fff进行split操作,分成fh∈RC/r×H×1f^h\in \mathbb{R}^{C/r\times H \times1}fh∈RC/r×H×1和fw∈RC/r×1×Wf^w\in \mathbb{R}^{C/r\times1\times W}fw∈RC/r×1×W,然后分别利用1×11 \times 11×1卷积进行升维度操作,再结合sigmoid激活函数得到最后的注意力向量gh∈RC×H×1g^h \in \mathbb{R}^{C \times H \times 1 }gh∈RC×H×1和gw∈RC×1×Wg^w\in \mathbb{R}^{C \times1\times W}gw∈RC×1×W。 最后:Coordinate Attention 的输出公式可以写成:

代码

代码粘贴自github。CoordAttention 地址:https://github.com/houqb/CoordAttention/blob/main/mbv2_ca.py

class CoordAtt(nn.Module): def __init__(self, inp, oup, groups=32): super(CoordAtt, self).__init__() self.pool_h = nn.AdaptiveAvgPool2d((None, 1)) self.pool_w = nn.AdaptiveAvgPool2d((1, None)) mip = max(8, inp // groups) self.conv1 = nn.Conv2d(inp, mip, kernel_size=1, stride=1, padding=0) self.bn1 = nn.BatchNorm2d(mip) self.conv2 = nn.Conv2d(mip, oup, kernel_size=1, stride=1, padding=0) self.conv3 = nn.Conv2d(mip, oup, kernel_size=1, stride=1, padding=0) self.relu = h_swish() def forward(self, x): identity = x n,c,h,w = x.size() x_h = self.pool_h(x) x_w = self.pool_w(x).permute(0, 1, 3, 2) y = torch.cat([x_h, x_w], dim=2) y = self.conv1(y) y = self.bn1(y) y = self.relu(y) x_h, x_w = torch.split(y, [h, w], dim=2) x_w = x_w.permute(0, 1, 3, 2) x_h = self.conv2(x_h).sigmoid() x_w = self.conv3(x_w).sigmoid() x_h = x_h.expand(-1, -1, h, w) x_w = x_w.expand(-1, -1, h, w) y = identity * x_w * x_h return y最后

CA不仅考虑到空间和通道之间的关系,还考虑到长程依赖问题。通过实验发现,CA不仅可以实现精度提升,且参数量、计算量较少。

简单进行记录,如有问题请大家指正。

本文链接地址:https://www.jiuchutong.com/zhishi/290832.html 转载请保留说明!

上一篇:el-table(type=“selection“)多选框两种回显

下一篇:鸟瞰皮纳图博火山湖和山脉,菲律宾波拉克 (© Amazing Aerial Agency/Offset by Shutterstock)(bestars皮纳)

  • iPhone14没有mini吗(iphone14还有mini吗)

    iPhone14没有mini吗(iphone14还有mini吗)

  • 文件夹如何设置密码(文件夹如何设置一打开就是列表方式)

    文件夹如何设置密码(文件夹如何设置一打开就是列表方式)

  • 苹果x深色模式如何打开(苹果X深色模式会不会比较省电)

    苹果x深色模式如何打开(苹果X深色模式会不会比较省电)

  • 钉钉怎么修改群备注(钉钉怎么修改群昵称名字)

    钉钉怎么修改群备注(钉钉怎么修改群昵称名字)

  • qq亲密度90算高吗(qq亲密度93高吗)

    qq亲密度90算高吗(qq亲密度93高吗)

  • 暂时无法提供白条服务是什么意思(暂时无法提供白条怎么办)

    暂时无法提供白条服务是什么意思(暂时无法提供白条怎么办)

  • 好友辅助后多久能找回密码(好友辅助后多久能登陆)

    好友辅助后多久能找回密码(好友辅助后多久能登陆)

  • 腾讯doki是什么意思(腾讯视频doki是什么意思)

    腾讯doki是什么意思(腾讯视频doki是什么意思)

  • 拼接处理器和矩阵的区别(拼接处理器和矩阵处理器做得比较好的有哪些)

    拼接处理器和矩阵的区别(拼接处理器和矩阵处理器做得比较好的有哪些)

  • iphone7运行内存不足导致程序无法使用(iphone7运行内存多大)

    iphone7运行内存不足导致程序无法使用(iphone7运行内存多大)

  • 抖音出现熟人什么功能关闭(抖音熟悉的人是什么意思)

    抖音出现熟人什么功能关闭(抖音熟悉的人是什么意思)

  • win10开机自启动在哪里设置(win10开机自启动文件夹路径)

    win10开机自启动在哪里设置(win10开机自启动文件夹路径)

  • vivo手机usb调试在哪(vivo手机的usb调试功能在哪里打开)

    vivo手机usb调试在哪(vivo手机的usb调试功能在哪里打开)

  • 拼多多自动续费怎么关(拼多多自动续费多少钱一个月)

    拼多多自动续费怎么关(拼多多自动续费多少钱一个月)

  • 如何修改实名认证资料(如何修改实名认证游戏)

    如何修改实名认证资料(如何修改实名认证游戏)

  • 高校校园app开发怎么做(高校校园app开发)

    高校校园app开发怎么做(高校校园app开发)

  • 为什么别人打电话过来显示未知(为什么别人打电话打不进来)

    为什么别人打电话过来显示未知(为什么别人打电话打不进来)

  • 三星怎么录屏(三星怎么录屏手机怎么录屏)

    三星怎么录屏(三星怎么录屏手机怎么录屏)

  • 网上购电后需要插卡吗(网上购电后需要缴费吗)

    网上购电后需要插卡吗(网上购电后需要缴费吗)

  • 360极速浏览器如何清除缓存(360极速浏览器如何倍速播放)

    360极速浏览器如何清除缓存(360极速浏览器如何倍速播放)

  • 苹果7p悬浮球在哪设置(苹果7p悬浮球在哪里关闭)

    苹果7p悬浮球在哪设置(苹果7p悬浮球在哪里关闭)

  • 王者荣耀中哪吒技能有哪些?(王者荣耀中哪吒的图片)

    王者荣耀中哪吒技能有哪些?(王者荣耀中哪吒的图片)

  • Origin曲线拟合教程(origin2017曲线拟合)

    Origin曲线拟合教程(origin2017曲线拟合)

  • python中事件处理的方法

    python中事件处理的方法

  • 知识产权入股需要过户给对方么
  • 建筑业小规模纳税人预缴增值税
  • 房地产企业年报台账怎么填
  • 公司帮其他单位开发票违法吗
  • 购入库存商品未付款怎么做账
  • 单位发放中秋月饼价值有规定吗
  • 提供应税服务的企业
  • 无形资产资本化会计处理
  • 银行存款一直没动会怎样
  • 应收票据会计分录怎么做
  • 给别人开的维修费专票怎么入账
  • 不同税率的增值税如何报税
  • 取得增值税专用发票是否可以抵扣
  • 取得增值税专用发票
  • 未报税会怎么样
  • 公积金抵扣个税上限
  • 2017年7月1日开始实施的税法新规
  • 以前年度城建税减免可以计去营业外收入嘛
  • 车辆违章罚款怎么入账
  • 研发支出费用如何计算应交所得税?
  • 房地产企业预缴增值税如何申报
  • 餐饮调理产品有哪些
  • 挂靠车辆可以抵扣进项税么?
  • 道路工程施工机械
  • 净资产是不是包含设备
  • win10 kb5005611
  • 美金收入 如何交税
  • 在win7系统中安装win10
  • 暂估入账收入会计分录
  • 销售商品售后回购
  • 来料加工方式中,料件和加工后成品的所有权
  • pavprot.exe - pavprot是什么进程 作用是什么
  • 企业固定资产有哪些
  • lnmgr.exe是什么
  • win10开机强制进入安全模式重置
  • js身份证正则验证
  • netty websocket心跳
  • print函数php
  • 电子退库款
  • 房地产企业季度所得税预缴扣除附加税吗
  • 专利年费缴纳详细流程
  • 个体户一直未申报会怎样
  • 劳务派遣申报表附表一怎么填
  • 用工会经费给员工发工资
  • 数字黑洞有哪些
  • 开一般户需要基本户开户许可证吗
  • sql注入攻击代码
  • 存货的入账价值等于
  • 电脑买回来可以直接用吗
  • 营业成本怎么理解
  • 已计提教育费附加但是未扣除个税
  • 咨询企业发生的费用计入
  • 应交消费税等于
  • mysql基本表
  • nano linux
  • 怎样u盘安装系统软件
  • win8defender怎么打开
  • linux find命令忽略大小写
  • 网站出现问题怎么办
  • wow血条插件
  • ubuntu 编译ffmpeg
  • Unity3D游戏开发标准教程吴亚峰于复兴人民邮电出版社
  • unity游戏之友利拟收购《刀塔传奇》发行商中清龙图
  • bootstrap需要学多久
  • 如何旋转图片30度
  • 基于豆瓣电影数据linux
  • nodejs使用视频教程
  • cocos lua调试
  • 多了一个本地磁盘
  • js实现自动定时功能
  • 注释讲解
  • javascript自定义函数
  • android.view.window.addflags
  • python向csv写入数据
  • 纳税人识别号不能含有IOZSV
  • 进出口备案登记表是哪个部门发的
  • 税务鉴定收费标准
  • 跨市变更税务登记要多久
  • 国家税务局查询发票
  • 请问报考国家税务局难吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设