位置: IT常识 - 正文

RGB与Depth融合方法总结(rgb to hex)

编辑:rootadmin
RGB与Depth融合方法总结

推荐整理分享RGB与Depth融合方法总结(rgb to hex),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:rgbd和rgb的区别,rgb合成公式,rgb to hex,rgb合在一起是什么颜色,rgb混在一起,rgb合在一起是什么颜色,rgb合在一起是什么颜色,rgb to hex,内容如对您有帮助,希望把文章链接给更多的朋友!

RGB与Depth融合方法总结(rgb to hex)

1:在MMFNet中作者提出了几种传统的融合方法,(a)将RGB和Depth首先concat然后经过卷积最后生成特征图。(b)将RGB和Depth分别进行卷积,然后再add融合。(c)将RGB和Depth先进行卷积,经过transformation,再经过反卷积,融合起来。(d)RGB和Depth分别卷积,将depth融合再分别经过卷积,最后经过反卷积。这些经典的方法仍然有参考意义。

2:MMFNet的融合方法,其中RCU模块就像是SENet的雏形,不过当时还没有提出注意力机制。MRF模块就参考了上图中的b。

3:我自己试过的通过ASPP来对RGB和Depth进行特征提取,但是效果很不好。类似于这一种,分别对RGB和Depth进行PPM或者ASPP操作,然后进行拼接,最后经过1x1卷积,效果都不够好,可以说不如注意力机制。 4:出自Deep Surface Normal Estimation with Hierarchical RGB-D Fusion,是用来预测表面法线的,还没有看,先挖个坑。 5:接着就是注意力机制,包括SA-Gate,将RGB和Depth进行拼接,然后经过global pooling操作,得到1x1卷积再与本身相乘,然后再经过拼接,经过softmax得到一个权重,与原始图片进行相乘,两个注意力都用到了,他的点在于图像的去噪,将图像分离,去噪,融合,再分离,再融合。 6:在ESANet中应用了SENet中的Sequeeze-and-Excitation模块,将RGB和Depth分别进行 Sequeeze-and-Excitation,经过通道注意力,会学到应该关注于那些通道,相当于某些通道乘了一个大的权重,然后再与深度进行融合。 6:除了应用SENet中即插即用的模块,CANet还应用了非局部注意力来融合RGB和Depth。这个方法在DANet的创新点上进行创新。 DANet: CANet: CANet意图很清晰,通过RGB和Depth进行非局部注意力,得到的权重乘以Depth,然后和RGB进行融合,分别在空间上和通道上进行注意力融合,得到的结果再进行1x1卷积和纹理融合,可以说融合的很充分了。

随便揣测一下,这些操作都像是非局部注意力和深度可分离卷积的变形,非局部注意力,通过两个modality进行注意力得到的权重乘以原来的图片,深度可分离卷积,通过卷积核来聚合多个通道的信息,在经过1x1卷积来进行空间的遍历。

综上这是目前看到的RGB和Depth融合策略,以后看到了再补充。 -------------------------------------------------------补充----------------------------------------------------------------------------------------------------- 7:最近读了一篇CMX**,是nyu数据集上排名第一的方法,包含了深度与RGB融合方法: 其中FRM模块与SA-Gate的方法十分类似,都是通过进行特征图校准来去噪,CMX通过逐通道校准和逐空间校准,最后生成两个输出,SA-Gate则是通过通道的压缩和聚合来实现的,不过本质上也是注意力。 除此以外CMX还是用了Transformer来进行特征的交互和融合,最后再通过一个通道编码得到最终输出。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 8:最近读了一篇FRNet,作者受到SA-Gate的启发,提出了一种跨层跨模态的融合策略。主要使用这种top-down结构,通过将高层次语义信息和低层次特征信息进行融合。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 9:这是一篇2022最新的文章,Attention-based Dual Supervised Decoder for RGBD Semantic Segmentation,没有代码。和之前的融合方法有差别,但是差别不大。每一层融合之后不连接,融合方法就是注意力,创新点主要是后面的双分支decoder。在depth分支上采样到最后起到了监督的作用。 ---------------------------------------------------------------补充---------------------------------------------------------------------------------- 10:TransD-Fusion:transformer用于RGB-D融合来进行语义分割,在两个分支encoder的尾部进行融合。通过自注意力,交叉注意力,深度引导三步进行融合。在NYU上的miou达到了55.5。其中融合的部位和CANet一样,融合的方法在CMX也使用到了,交叉的transformer注意力。 11:在看TransD-Fusion文章的时候,他引用了一篇文章PGDENet: Progressive Guided Fusion and Depth Enhancement Network for RGB-D Indoor Scene Parsing也是RGB-D融合的,我就进去看了一下架构图,和之前的FRNet几乎一样,模型很像,就不仔细看了。 主要看一下PCFM模块和DEM模块: 12:RGB‑D Gate‑guided edge distillation for indoor semantic segmentation文章引入了边界引导,RGB和Depth分别处理,其中融合的结果作为一条单独的分支进行传递。在边界特征部分用到了原始GT进行边缘提取的边缘损失。

本文链接地址:https://www.jiuchutong.com/zhishi/297492.html 转载请保留说明!

上一篇:nvm介绍、安装、报错处理以及使用(nvm安装教程)

下一篇:一天撸一个财务APP系统【安卓端+前端+后端】

  • 微博推广必须注意的要素(微博推广必须注册吗)

    微博推广必须注意的要素(微博推广必须注册吗)

  • 荣耀70pro+在哪里设置时间(荣耀7vpro)

    荣耀70pro+在哪里设置时间(荣耀7vpro)

  • ipad看视频怎么全屏(ipad看视频怎么小窗口)

    ipad看视频怎么全屏(ipad看视频怎么小窗口)

  • 小米温度计怎么连接手机(小米温度计怎么连接蓝牙)

    小米温度计怎么连接手机(小米温度计怎么连接蓝牙)

  • qq主题字体如何设置(qq的主题字体怎么换字体)

    qq主题字体如何设置(qq的主题字体怎么换字体)

  • 人计算与机器计算的差别是什么(人计算与机器计算有什么差)

    人计算与机器计算的差别是什么(人计算与机器计算有什么差)

  • iphone进网许可很重要吗(苹果手机进网许可)

    iphone进网许可很重要吗(苹果手机进网许可)

  • 抖音有群发功能吗(抖音群发功能软件)

    抖音有群发功能吗(抖音群发功能软件)

  • 手机无缘无故没信号(手机无缘无故没信号重启都没用)

    手机无缘无故没信号(手机无缘无故没信号重启都没用)

  • 手机感光坏了有什么影响(手机感光器坏了会出现什么情况)

    手机感光坏了有什么影响(手机感光器坏了会出现什么情况)

  • dell开不了机(dell开不了机闪黄灯)

    dell开不了机(dell开不了机闪黄灯)

  • 充电线和数据线的区别(充电线和数据线怎么区分)

    充电线和数据线的区别(充电线和数据线怎么区分)

  • 无法接通到移动网络怎么办(怎么连接移动网络)

    无法接通到移动网络怎么办(怎么连接移动网络)

  • mate20左上角出现hd(华为mate20右上角)

    mate20左上角出现hd(华为mate20右上角)

  • oppoa3怎么设置呼吸灯红光(oppoa3手机呼叫转移怎么设置)

    oppoa3怎么设置呼吸灯红光(oppoa3手机呼叫转移怎么设置)

  • 抖音怎么看对方在不在线(抖音怎么看对方跟谁聊天)

    抖音怎么看对方在不在线(抖音怎么看对方跟谁聊天)

  • 滴滴出行为什么要预付(滴滴出行为什么要先预付车费)

    滴滴出行为什么要预付(滴滴出行为什么要先预付车费)

  • 如何给word文档加边框(如何给word文档加下划线)

    如何给word文档加边框(如何给word文档加下划线)

  • 学籍证明怎么打印(学籍证明怎么打出来)

    学籍证明怎么打印(学籍证明怎么打出来)

  • 腾讯文档在线编辑怎么保存(腾讯文档在线编辑怎么不让其他人看见)

    腾讯文档在线编辑怎么保存(腾讯文档在线编辑怎么不让其他人看见)

  • 怎样下载电影到桌面(怎样下载电影到移动硬盘)

    怎样下载电影到桌面(怎样下载电影到移动硬盘)

  • 苹果xs机身尺寸厘米(苹果xs的手机尺寸)

    苹果xs机身尺寸厘米(苹果xs的手机尺寸)

  • 荣耀coral10什么型号(荣耀十col-al10)

    荣耀coral10什么型号(荣耀十col-al10)

  • 手机人脸识别可以用照片吗(手机人脸识别可以用视频解锁吗)

    手机人脸识别可以用照片吗(手机人脸识别可以用视频解锁吗)

  • 增量留抵税额会计处理
  • 中外合资企业要交什么税
  • 买房子一定要交税吗
  • 单位收到已交个税的劳务发票还需要申报个税吗
  • 个人动产租赁税费怎么算
  • 填仓2021
  • 企业为职工购买的商业保险属于职工薪酬吗
  • 研发设备的定义
  • 分票报关合票出提单怎么清关
  • 纳税调整增加额和纳税调整减少额
  • 小规模纳税人附加税优惠政策2023
  • 工会经费向地方税务局缴纳的比例是多少
  • 装修费算固定资产吗?
  • 银行转账结算凭证按照填制手续和内容
  • bios设置光驱为第一启动项
  • 定期定额征收的个体户怎么报税
  • 疫情 统筹
  • 浅谈25年Linux内核开发经历总结出来的九条经验
  • 清除文件夹exe病毒工具
  • php多表联合查询
  • 长期待摊费用的概念
  • 什么是所得税收入
  • win11更新卡主
  • 如何安装iis网站服务器
  • php bi
  • el-table-column formatter
  • 犹他州现神秘物体
  • php7.2编译安装
  • php代码报错
  • php比较大小
  • uniapp route
  • gparted 命令行
  • 下载下来是php
  • 发票没有填写开户行,可以报销吗
  • 结存成本怎么计算先进先出法
  • 小规模纳税人广告税率是多少
  • 年终企业所得税怎么结转
  • python怎么过滤多余空格
  • 织梦图片集如何调用
  • mysql服务器怎么启动
  • 生产企业的模具费用计入什么科目
  • 汇算清缴后取得上一年发票
  • 代扣代缴公积金现金流量
  • 固定资产抵扣进项税额最新规定
  • 应收账款占比高受哪些因素影响
  • 会计分录什么时候用负数表示
  • 分期付款进项税额怎么算
  • 高新企业研发项目规定几个
  • 工业企业建立账套
  • mysql的子查询语句
  • 数据库汉字转拼音
  • mysql5.7.27安装
  • 教你鉴别耳机音质的好坏的几大技巧
  • win8系统任务栏怎么隐藏
  • windows10的改进
  • windows vista在哪里
  • redhat操作系统安装步骤
  • freebsd操作命令
  • win7系统玩游戏
  • windows7调制解调器在在哪里打开
  • linux nc命令详解
  • win8.1其他用户名登不进去
  • 多文件操作
  • windows8优化
  • cocos jsc
  • js小球与边框碰撞反弹
  • unable to instantiate default
  • Android之Android apk动态加载机制的研究(二):资源加载和activity生命周期管理
  • python,数组
  • pygal python
  • java的gui框架
  • 原生js实现节日变化
  • js如何使用
  • 蓝色的css代码
  • jquery实例
  • Android ViewPager+Fragment滑动选项卡,tab点击选项卡
  • jquery实现全选全不选
  • 福建省电子税务局官网登录入口
  • 购买房屋交契税
  • 单位固定资产转到个人名下要交税吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设