位置: IT常识 - 正文

RGB-T追踪——【多模态融合】Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline(rgbt目标跟踪)

编辑:rootadmin
RGB-T追踪——【多模态融合】Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline 目录RGB-T追踪算法简介HMFT图像互补信息融合【CIF】辨别力特征的信息融合【DFF】适应性决策融合【ADF】算法流程

推荐整理分享RGB-T追踪——【多模态融合】Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline(rgbt目标跟踪),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:rgbt跟踪,rgbquad,rgb(),rgb(),rgbquad,rgb(),rgbquad,rgbt跟踪,内容如对您有帮助,希望把文章链接给更多的朋友!

这篇论文既提出了一个大规模的RGB-T追踪的数据集,也相应提出了一个Baseline,在现有多个数据集上 GTOT / RGB210 / RGB234 上获得了最好的性能。 关于这篇论文中数据集相关的信息请见这篇博客RGB-T追踪——【数据集基准】GTOT / RGBT210 / RGBT234 / VOT-2019-2020 / LasHeR / VTUAV

HMFT:论文 数据集

RGB-T追踪算法简介

通常RGB-T追踪器主要用了RGB追踪器相似的pipeline,然后聚焦于设计一个两模态融合方法。现有的融合方法主要分为:图片融合、特征融合、决策融合三类。

【图片融合】:利用BackBone网络,以共享权重的方式学习可见光图片和热红外图片的图片特征,并且学出来的这个共享权重相当于取了可见光图片和热红外图片中对定位目标有用的一致的信息。这种方法存在的缺陷是需要可见光图片和热红外图片高度对齐。【特征融合】:大多数Tracker是融合可见光图片和热红外图片的特征。这里也有两种融合:1. 用一个模态作为辅助模态对另一个模态进行refine;2. 先直接把两个模态的特征拼接(通常按channel-wise),再通过深度网络学习一个新的两个模态交互后的特征。这种方法的优点是灵活性高,对图片的对齐要求不高。【决策融合】:每个模态独立输出对目标的估计,以response map的形式,然后再融合这两个模态的决策,输出一个final score。HMFT

这个模型就容纳了以上这三种融合方法。模型图如下,可以看到 HMFT 框架有两个分支:Discriminative bransh 分支和Complementary bransh 分支。主要由3个主要模块组成:CIF / DFF / ADF。

Discriminative bransh 分支:Complementary bransh 分支 :图像互补信息融合【CIF】

这个模块的作用是学习两个模态中目标相关的一致性信息。

模块的输入:IvI_vIv​和ItI_tIt​分别表示RGB图片和Thermal图片。蓝色部分是提取互补信息的网络【Comp. Backbone】,即ResNet50,共享权重,提取共同的特征。这里的LdivL_{div}Ldiv​是KL-散度的Loss函数,作用是为了保持这两个模态的一致性,用KL散度约束特征的分布。所以在训练的时候,学习的目标函数就是使这两个backbone网络输出的特征尽可能相同。也相当于考虑了一致的信息。目标函数如下: 其中PviP_v^iPvi​和PtiP_t^iPti​分别表示visible图片和thermal图片在ResNet50第iii层的特征。所以这是每层特征的KL散度之和求最小。输出是按channel-wise拼接起来的特征Pa∈R2C∗H∗WP_a \in \mathbb{R}^{2C*H*W}Pa​∈R2C∗H∗W,原本的特征维度为Pv/t∈RC∗H∗WP_{v/t} \in \mathbb{R}^{C*H*W}Pv/t​∈RC∗H∗W。辨别力特征的信息融合【DFF】RGB-T追踪——【多模态融合】Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline(rgbt目标跟踪)

这个模块的作用是学习两个模态信息中不同的具有判别力的信息。RGB图像可以提供强大的外观信息;红外图像可以提供目标轮廓有关的信息。所以先单独对着两个模态建模,生成特征再融合。具体流程如下:

模型的输入:Backbone网络对两个模态独立输出特征FvF_vFv​、FtF_tFt​

蓝色框:将FvF_vFv​、FtF_tFt​通过对应元素相加(Elem.Sum)合起来,经过一个全局平均池化(GAP)和全连接层(FC)得到一个全局向量dgd_gdg​,包含了两个模态的信息。公式表达如下:这里DvD_vDv​、DtD_tDt​就是对应FvF_vFv​、FtF_tFt​,应该是笔误。

橙色框:利用两个独立的模态专属全连接层ϝv\digamma_vϝv​、ϝt\digamma_tϝt​+softmax操作生成模态专属的channel-wise的权重wvw_vwv​,wt∈RC∗1∗1w_t\in \mathbb{R}^{C*1*1}wt​∈RC∗1∗1。 #pic_center)

红色框:用计算出的权重wvw_vwv​,wtw_twt​用channel-wise乘法的方式与最初的模态特征FvF_vFv​、FtF_tFt​相乘,再相加。

模块的输出:融合后的特征DaiD_a^iDai​

适应性决策融合【ADF】

这个模块的作用是基于CIF、DFF 分支独立输出的特征图,计算这些特征图的置信度,根据置信度计算这些特征图的权重对特征图加权,再产生最终的特征图。

模块的输入:CIF、DFF 分支独立输出的特征图PaP_aPa​和DaD_aDa​。MAM 模块的作用是基于自注意力机制分别获取一致性分支和判别力分支置信度McM_cMc​、MdM_dMd​。具体操作是:对于输入的特征XXX,也就是上面的PaP_aPa​和DaD_aDa​,先通过1*1的卷积降低特征维度(为了降低计算量),再经过Reshape操作,将XXX的shape从C×W×HC \times W \times HC×W×H变成C×WHC \times WHC×WH,作为自注意力机制中的特征嵌入,得到HW×CHW \times CHW×C的特征,再对channel加和再reshape得到H×W×1H \times W \times 1H×W×1的模型置信度。计算如下: 将McM_cMc​和MdM_dMd​ 拼接起来,输入到一个两层的Encoder-Decoder网络中,得到模态各自的权重Ec,Ed∈RH∗WE_c, E_d \in \mathbb{R}^{H*W}Ec​,Ed​∈RH∗W。这个权重对CIF、DFF 分支独立输出的响应图RcR_cRc​和RdR_dRd​作element-wise乘(加权操作)得到RFR_FRF​。 RF=Rd⊙Ed+Rc⊙EcR_F=R_d \odot E_d+R_c \odot E_cRF​=Rd​⊙Ed​+Rc​⊙Ec​算法流程

对于当前的追踪图片

两个分支Discriminative branch和Complementary branch 分别采用特征融合方法和图片信息融合方法得到目标响应图;利用ADF,对两个分支Discriminative branch和Complementary branch 的响应图进行融合,生成最终响应图;利用DiMP中IoU预测模块,对最终响应图中取10个proposal,再对proposal预测IoU分数,取分数最高的三个proposal作平均,输出最终的预测边界框。

QQQQQ QQ Q

本文链接地址:https://www.jiuchutong.com/zhishi/292356.html 转载请保留说明!

上一篇:如何实现chrome谷歌浏览器多开(独立环境 独立cookie)(chrome怎么用谷歌)

下一篇:农业病虫害数据集与算法——调研整理(2020年农业病虫害)

  • 微博密码忘了怎么修改(微博密码忘了怎么办)

    微博密码忘了怎么修改(微博密码忘了怎么办)

  • 如何用qq同步助手把通讯录导入新手机(如何用QQ同步助手把华为手机资料转到苹果手机)

    如何用qq同步助手把通讯录导入新手机(如何用QQ同步助手把华为手机资料转到苹果手机)

  • 闲鱼订单回收站在哪(闲鱼订单回收站网址)

    闲鱼订单回收站在哪(闲鱼订单回收站网址)

  • 微信聊天记录可以导出成文本吗(微信聊天记录可以恢复多久以前的)

    微信聊天记录可以导出成文本吗(微信聊天记录可以恢复多久以前的)

  • oppoa8怎么关闭运行程序(oppo怎么关闭运行程序)

    oppoa8怎么关闭运行程序(oppo怎么关闭运行程序)

  • iPhone远程可以改锁屏密码吗(iphone如何远程改密码)

    iPhone远程可以改锁屏密码吗(iphone如何远程改密码)

  • qq限制附近功能是什么意思(qq限制附近功能怎么办)

    qq限制附近功能是什么意思(qq限制附近功能怎么办)

  • 序列号d开头的苹果(序列号D开头的好不好)

    序列号d开头的苹果(序列号D开头的好不好)

  • 听喜马拉雅老是自己停怎么办(喜马拉雅为什么听着听着就断暂停)

    听喜马拉雅老是自己停怎么办(喜马拉雅为什么听着听着就断暂停)

  • 微信两个手机登录聊天记录同步吗(微信两个手机登录会不会封号)

    微信两个手机登录聊天记录同步吗(微信两个手机登录会不会封号)

  • 无边框手机有哪几款(全球首款无边框手机)

    无边框手机有哪几款(全球首款无边框手机)

  • ipad6代多少寸	(ipad6代是几寸)

    ipad6代多少寸 (ipad6代是几寸)

  • 通常说的百兆局域网的网络速度是(百兆什么意思)

    通常说的百兆局域网的网络速度是(百兆什么意思)

  • 手机wifi叹号无互联网连接(手机无线网叹号)

    手机wifi叹号无互联网连接(手机无线网叹号)

  • iphone11pro港版支持电信吗(iphone11pro港版支持eSIM)

    iphone11pro港版支持电信吗(iphone11pro港版支持eSIM)

  • 滴滴什么时候开始的(滴滴什么时候开始火的)

    滴滴什么时候开始的(滴滴什么时候开始火的)

  • 华为gt2代什么时候上市(华为gt2多久发布的)

    华为gt2代什么时候上市(华为gt2多久发布的)

  • mate30支持nfc吗(华为mate 30支持nfc吗)

    mate30支持nfc吗(华为mate 30支持nfc吗)

  • 抖音怎么删通讯录推荐(抖音通讯录怎么删除联系人)

    抖音怎么删通讯录推荐(抖音通讯录怎么删除联系人)

  • airpods耳机盒能定位吗(airpods耳机盒能发声吗)

    airpods耳机盒能定位吗(airpods耳机盒能发声吗)

  • 红米note8pro能插内存卡吗(红米note8pro能插内存卡不)

    红米note8pro能插内存卡吗(红米note8pro能插内存卡不)

  • 苹果xr前置呼吸灯(苹果xr前置呼吸灯显示效果视频)

    苹果xr前置呼吸灯(苹果xr前置呼吸灯显示效果视频)

  • v1730ea是什么型号(v1730ea是vivo什么型号)

    v1730ea是什么型号(v1730ea是vivo什么型号)

  • 闲鱼禁言怎么解除(闲鱼禁言怎么解决)

    闲鱼禁言怎么解除(闲鱼禁言怎么解决)

  • 借条丢了怎么办?(借条丢了怎么办打电话给家长)

    借条丢了怎么办?(借条丢了怎么办打电话给家长)

  • 一般纳税人增值税税率
  • 劳务清包违法吗?
  • 销售人员的工资属于什么会计科目
  • 非经营性资产包括哪些科目
  • 减税降费对企业的影响案例
  • 测绘费能否在土地出让
  • 对公账户的钱怎么取出来才不用交税
  • 固定资产附加的账务处理
  • 小企业所得税申报流程
  • 公司付给职工的工资
  • 融资租赁的租金包括
  • 开专票附加8个税点怎么计算?
  • 快消品应收账款风险策划方案
  • 混凝土增值税政策
  • 可转换债券转换权的价格怎么算
  • 加盟商的作用
  • 小规模附加税申报表填写范本
  • 申请银行汇票手续费记账凭证
  • 个体工商户申报流程图
  • 公司房产税如何征收税率
  • 按键盘不起作用怎么办
  • win10开机启动文件路径
  • windows hosts文件在哪
  • 进项票月初收到能抵上月
  • 有限公司注册资本500万就真的有500万吗
  • 磁盘碎片指的是磁盘因为长期使用
  • php干啥用
  • 台式电脑清洗步骤图解
  • seti@home.exe - seti@home是什么进程 有什么用
  • 会计核算的实训目的
  • 资本化计入
  • 非合理损耗怎么做分录
  • php 自动加载
  • eslint vue配置
  • 德国楚格峰一日游攻略
  • 一般纳税人开出13%的普通发票怎么扣税
  • nginx for linux
  • javaweb入门简单小项目
  • nginx解决跨域问题原理
  • 手把手的教
  • 加计减免的分录怎么做
  • 顺丰电子发票开票失败需要怎么处理?
  • 职工福利费怎么处理
  • 租赁增值税发票税率
  • 年度财务报表分为哪几类
  • 金蝶怎么设置销售出库单模板
  • 个人社保交错了怎么办
  • 小企业会计准则2023电子版
  • 暂存款账务处理
  • 固定资产补入账和补提折旧
  • 2021个税新规工资表公式
  • 库存股属于什么账户
  • 农副产品收购分录
  • 有差价的商品发票怎么开
  • 有限公司股东撤资退股
  • 物业门禁卡怎么入账
  • 保安公司购买的保险
  • 红字冲销表示负数吗
  • 申报个税劳务报酬按20%扣
  • 建筑企业工程施工科目怎么结转
  • mysql的安全级别
  • sqlserver数据库怎么导出
  • mysql8.0无法启动
  • winsvc是什么进程
  • window10自带的软件有哪些
  • ps到底怎么用
  • win8系统没有wifi
  • 如何判断win7
  • 可用分区az
  • win10多任务视图不排序怎么设置
  • excel嵌入图片变成代码怎么办
  • css渐变文本效果在哪
  • css ie6 ie7 ff的CSS hack使用技巧
  • android 基础
  • 计算字符串的长度使用哪个函数?
  • node js模块
  • unity 摄像机
  • unity控制组件开关
  • 猫的喵喵
  • 深圳机打发票查询
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设