位置: IT常识 - 正文

RGB与Depth融合方法总结(rgb to hex)

编辑:rootadmin
RGB与Depth融合方法总结

推荐整理分享RGB与Depth融合方法总结(rgb to hex),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:rgbd和rgb的区别,rgb合成公式,rgb to hex,rgb合在一起是什么颜色,rgb混在一起,rgb合在一起是什么颜色,rgb合在一起是什么颜色,rgb to hex,内容如对您有帮助,希望把文章链接给更多的朋友!

RGB与Depth融合方法总结(rgb to hex)

1:在MMFNet中作者提出了几种传统的融合方法,(a)将RGB和Depth首先concat然后经过卷积最后生成特征图。(b)将RGB和Depth分别进行卷积,然后再add融合。(c)将RGB和Depth先进行卷积,经过transformation,再经过反卷积,融合起来。(d)RGB和Depth分别卷积,将depth融合再分别经过卷积,最后经过反卷积。这些经典的方法仍然有参考意义。

2:MMFNet的融合方法,其中RCU模块就像是SENet的雏形,不过当时还没有提出注意力机制。MRF模块就参考了上图中的b。

3:我自己试过的通过ASPP来对RGB和Depth进行特征提取,但是效果很不好。类似于这一种,分别对RGB和Depth进行PPM或者ASPP操作,然后进行拼接,最后经过1x1卷积,效果都不够好,可以说不如注意力机制。 4:出自Deep Surface Normal Estimation with Hierarchical RGB-D Fusion,是用来预测表面法线的,还没有看,先挖个坑。 5:接着就是注意力机制,包括SA-Gate,将RGB和Depth进行拼接,然后经过global pooling操作,得到1x1卷积再与本身相乘,然后再经过拼接,经过softmax得到一个权重,与原始图片进行相乘,两个注意力都用到了,他的点在于图像的去噪,将图像分离,去噪,融合,再分离,再融合。 6:在ESANet中应用了SENet中的Sequeeze-and-Excitation模块,将RGB和Depth分别进行 Sequeeze-and-Excitation,经过通道注意力,会学到应该关注于那些通道,相当于某些通道乘了一个大的权重,然后再与深度进行融合。 6:除了应用SENet中即插即用的模块,CANet还应用了非局部注意力来融合RGB和Depth。这个方法在DANet的创新点上进行创新。 DANet: CANet: CANet意图很清晰,通过RGB和Depth进行非局部注意力,得到的权重乘以Depth,然后和RGB进行融合,分别在空间上和通道上进行注意力融合,得到的结果再进行1x1卷积和纹理融合,可以说融合的很充分了。

随便揣测一下,这些操作都像是非局部注意力和深度可分离卷积的变形,非局部注意力,通过两个modality进行注意力得到的权重乘以原来的图片,深度可分离卷积,通过卷积核来聚合多个通道的信息,在经过1x1卷积来进行空间的遍历。

综上这是目前看到的RGB和Depth融合策略,以后看到了再补充。 -------------------------------------------------------补充----------------------------------------------------------------------------------------------------- 7:最近读了一篇CMX**,是nyu数据集上排名第一的方法,包含了深度与RGB融合方法: 其中FRM模块与SA-Gate的方法十分类似,都是通过进行特征图校准来去噪,CMX通过逐通道校准和逐空间校准,最后生成两个输出,SA-Gate则是通过通道的压缩和聚合来实现的,不过本质上也是注意力。 除此以外CMX还是用了Transformer来进行特征的交互和融合,最后再通过一个通道编码得到最终输出。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 8:最近读了一篇FRNet,作者受到SA-Gate的启发,提出了一种跨层跨模态的融合策略。主要使用这种top-down结构,通过将高层次语义信息和低层次特征信息进行融合。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 9:这是一篇2022最新的文章,Attention-based Dual Supervised Decoder for RGBD Semantic Segmentation,没有代码。和之前的融合方法有差别,但是差别不大。每一层融合之后不连接,融合方法就是注意力,创新点主要是后面的双分支decoder。在depth分支上采样到最后起到了监督的作用。 ---------------------------------------------------------------补充---------------------------------------------------------------------------------- 10:TransD-Fusion:transformer用于RGB-D融合来进行语义分割,在两个分支encoder的尾部进行融合。通过自注意力,交叉注意力,深度引导三步进行融合。在NYU上的miou达到了55.5。其中融合的部位和CANet一样,融合的方法在CMX也使用到了,交叉的transformer注意力。 11:在看TransD-Fusion文章的时候,他引用了一篇文章PGDENet: Progressive Guided Fusion and Depth Enhancement Network for RGB-D Indoor Scene Parsing也是RGB-D融合的,我就进去看了一下架构图,和之前的FRNet几乎一样,模型很像,就不仔细看了。 主要看一下PCFM模块和DEM模块: 12:RGB‑D Gate‑guided edge distillation for indoor semantic segmentation文章引入了边界引导,RGB和Depth分别处理,其中融合的结果作为一条单独的分支进行传递。在边界特征部分用到了原始GT进行边缘提取的边缘损失。

本文链接地址:https://www.jiuchutong.com/zhishi/297492.html 转载请保留说明!

上一篇:nvm介绍、安装、报错处理以及使用(nvm安装教程)

下一篇:一天撸一个财务APP系统【安卓端+前端+后端】

  • 境外企业在中国境内承包建筑工程应在
  • 去年少交增值税的会计处理
  • 计提所得税分录计提的时候金额比实际缴纳多
  • 购销合同印花税按70%
  • 工商年报多久能显示
  • 生日卡片好看吗
  • 开票资料需要哪些内容
  • 个税申报填写的工资是应发还是实发
  • 技术服务费属于哪个商品编码
  • 高新技术企业费用认定
  • 股权转让评估费可以有公司承担吗
  • 代扣代缴附加税怎么做账
  • 汇算清缴补交所得税会计分录小企业会计政策
  • 企业自产自销的成本怎么核算?
  • 停车场增加收入
  • 计提减值准备怎么计算?
  • 业务招待费如何进行纳税调整
  • 递延收益的账务处理案例
  • 职工食堂操作流程图
  • 银行定期存款账户
  • win10玩游戏时弹出error
  • gif图片查看软件
  • 合并报表抵消分录实例
  • 民宿的房屋租赁合同模板
  • 辞职的补偿金怎么做账
  • 无形资产可以占多少比例
  • 腾讯手游助手如何隐藏键位
  • 在win7系统中文件属性有哪些
  • 官网下载的iso怎么用u盘安装
  • 如何才能显示效果更好
  • 以合同条款无法达成一致要求返还定金
  • php常用设计模式(大总结)
  • 自由职业者如何交五险一金
  • ccs ide
  • 设置浏览器显示网络异常
  • PHP:imagesettile()的用法_GD库图像处理函数
  • 专项基金设立
  • 资产减值损失会影响利润总额吗
  • php实现分页显示
  • 如何让别人访问自己的qq空间
  • 融资租出固定资产计入什么科目
  • 变更法人需要什么流程
  • 企业所有者权益是什么意思
  • 自然人税收管理系统扣缴客户端官网
  • 采购成本和销售成本的核算
  • 土地增值税清算全流程实战案例
  • 软件即征即退开票信息与资料不符
  • 研发费用明细科目怎么填
  • 无形资产的有效期限与法定保护期限相等
  • 城市维护建设税属于中央还是地方
  • 未分配利润是不是净利润的意思
  • 刻章费用怎么说
  • 设备租赁公司如何赚钱最快
  • 收到去年所得税退税款会计分录
  • 库存周转率中销量怎么算
  • 待处理财产损溢借贷反向
  • 试算平衡表的编制方法
  • 咨询公司销售费用有哪些
  • 涌泉的准确位置图 图解
  • windows server 2008的技巧:防止ping的方法
  • ubuntu server怎么样
  • macbookpro怎么测声音
  • win8本地账户
  • Windows RT 8.1 Update 3九月发布 届时将加入改进版锁屏
  • 在linux系统中,用来存放各种配置文件的目录
  • windows8ip地址怎么设置
  • 彻底理解样本方差为何除以n-1
  • eclipse cocos2dx Command line too long
  • unity jsonutility
  • android开发工程师案例教程源码
  • 不错的mod_perl编程的简单应用实例介绍
  • jquery 表格 排序
  • 如何使用开塞露排便
  • unity3d怎么编程
  • redis基础教程
  • 开票怎么查发票总额
  • 上海电子税务局怎么添加办税员
  • 中山大学税务硕士
  • 注册管理税务师和注册税务师的区别
  • 税务打虚打骗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设