位置: IT常识 - 正文

【三维目标检测】CenterPoint(一)(三维目标通用模板)

编辑:rootadmin
【三维目标检测】CenterPoint(一)

推荐整理分享【三维目标检测】CenterPoint(一)(三维目标通用模板),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:三维目标示例,三维目标通用模板,三维目标是什么意思?,三维目标示例,三维目标识别,三维目标还能用吗,三维目标识别,单目三维目标检测,内容如对您有帮助,希望把文章链接给更多的朋友!

        CenterPoint是一种anchor free的三维目标检测算法模型,发表在CVPR 2021,论文名称为《Center-based 3D Object Detection and Tracking》。其主要特点在于通过预测物体的中心点来进行目标检测和位置回归,而不需要预先产生大量候选框(anchor)。因而,这种方法的后处理更加简洁,相邻目标可通过直接选择热力图中心点来确定最终目标,不需要非极大值抑制(NMS)操作来合并重叠的候选框。但这也会带来一个缺点,CenterPoint无法区分同类型且中心点接近的目标。CenterPoint可看作是二维CorneNet和CenterNet到三维空间的一个扩展。因此,了解CornerNet和CenterNet模型有利于加深对CenterPoint的理解。CenterPoint和CenterNet来源于同一个课题组的研究成果。在nuScenes数据集的3D检测和跟踪任务中,单阶段的CenterPoint模型的NDS为65.5,AMOTA为63.8。

1 源码与输入数据

        接下来介绍的源码来源于mmdetection3d框架中的CenterPoint模型。mmdetection3d安装和调试验证可参考本专栏之前的博客【mmdetection3d】mmdetection3d安装详细步骤_Coding的叶子的博客-CSDN博客_mmdetection3d安装,里面有详细介绍。

        数据采用的是nuScenes数据集,完整版和Mini版均可。NuScenes数据集详细介绍请参考博文:nuScenes数据集详细介绍_Coding的叶子的博客-CSDN博客_nuscence数据集。

2 mmdetection3d nuScenes数据处理与模型训练

        mmdetection3d NuScenes处理过程请参考博文:mmdetection3d nuScenes (持续更新)_Coding的叶子的博客-CSDN博客。

        完整版NuScenes处理命令为:

python tools/create_data.py nuscenes --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes

        Mini版NuScenes处理命令为:

python tools/create_data.py nuscenes --version v1.0-mini --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes【三维目标检测】CenterPoint(一)(三维目标通用模板)

        在进行程序研究或调试时,建议直接采用Mini 版NuScenes,下载速度较快且占用存储空间较小。mmdetection3d NuScenes数据集预处理完成之后,运行下述命令即可开始CenterPoint训练。

python tools/train.py configs/centerpoint/centerpoint_0075voxel_second_secfpn_4x8_cyclic_20e_nus.py3 CenterPoint简介

        CenterPoint模型的整体结构如下图所示,由最初的一阶段模型扩展为了两阶段模型。第二阶段负责对第一阶段的检测结果进行微调修正,与基于候选框的两阶段目标检测思想基本一致。这里重点介绍CenterPoint的第一个阶段,并且单阶段的CenterPoint可直接完成对三维目标的检测。

图1 CenterPoint模型结构

        CenterPoint模型的关键数据和路径包含如下几个方面。带着这几个关键点来深入理解算法程序时效率会大大提高。

3.1 输入数据

        输入数据来源于nuScenes的顶部激光雷达点云数据。点云数据包含了空间三维坐标x、y、z、雷达反射强度和雷达线束序号,共5个维度。线束序号取值范围0~31,即雷达的32线。数据包括10个类别,分属6个大类,如下所示。

[['car'], ['truck', 'construction_vehicle'], ['bus', 'trailer'], ['barrier'], ['motorcycle', 'bicycle'], ['pedestrian', 'traffic_cone']]3.2 真实标签

        真实标签主要包括中心偏移(dx、dy)、高度(z)、尺寸对数(log(size_x)、log(size_y)、log(size_z))、偏航角正弦值(sin(rot))、偏航角余弦值(cos(rot))、速度(vx、vy)和热力图(heatmap)。

        每个热力图检测一个小类目标,即场景中相同类型目标的中心由同一个特征图来预测。因此,在计算热力图的真实标签时,同一类型多目标的高斯热力图可能会出现重叠,重叠时保留最大值。另一方面,在预测时,如果相邻的预测中心点其热力图峰值也相近,而后处理直接以最大取值作为最终预测结果。因此,CenterPoint无法区分同类型且中心点接近的目标。

3.3 模型推理

        CenterPoint模型推理过程如下:

输入点云通过体素化和稀疏卷积特征得到256x180x180特征图,尺度为180x180,特征维度为256。特征图通过Second主干网络和Neck拼接得到512x180x180维特征。由于输入数据被分为了6个大类,且每个热力图仅预测一类目标,因而模型预测任务也被分为6个Head。每个Head分别预测相应类别目标的位置偏移(reg,2x180x180)、高度(height,1x180x180)、尺寸(dim,3x180x180)、偏航角(rot,2x180x180)、速度(vel,2x180x180)、热力图(heatmap,Kx180x180)。其中,热力图维度中的K表示每个大类下的子类别个数,进步确定一个热力图只能预测一个类别。

        模型推理预测的结果与真实标签一一对应。热力图的损失函数为GaussianFocalLoss。其它预测值的损失函数为L1Loss,并且速度损失权重为0.2,其它权重均为1.0。

4 模型结构与代码详解

        模型详细结构及推理过程请参考下一篇博客:【三维目标检测】CenterPoint(二)_Coding的叶子的博客-CSDN博客。

5【python三维深度学习】python三维点云从基础到深度学习_Coding的叶子的博客-CSDN博客_三维点云深度学习
本文链接地址:https://www.jiuchutong.com/zhishi/287259.html 转载请保留说明!

上一篇:最贵的安卓应用是什么(最贵的安卓应用软件)

下一篇:antd的upload组件的各种上传、下载操作(vue)(antd upload组件)

  • 利用这些小技巧,让明星给你送流量(实用的小技巧)

    利用这些小技巧,让明星给你送流量(实用的小技巧)

  • 拼多多助力同一个用户可以助力几次(拼多多助力同一个人可以助力多少次)

    拼多多助力同一个用户可以助力几次(拼多多助力同一个人可以助力多少次)

  • snkrs一直很抱歉出错了(snkrs一直很抱歉出错了安卓)

    snkrs一直很抱歉出错了(snkrs一直很抱歉出错了安卓)

  • 微信号好久不登录就注销(微信号好久不登会怎么样)

    微信号好久不登录就注销(微信号好久不登会怎么样)

  • 钉钉打电话为什么没有来电通知(钉钉打电话为什么没有声音)

    钉钉打电话为什么没有来电通知(钉钉打电话为什么没有声音)

  • 为什么两部iphone同时来电(为什么两部iphone通话记录会相通)

    为什么两部iphone同时来电(为什么两部iphone通话记录会相通)

  • 微信有主题吗(微信有主题吗?)

    微信有主题吗(微信有主题吗?)

  • 笔记本电池拆了能直接通电用吗(笔记本电池拆了直接适配器可以吗)

    笔记本电池拆了能直接通电用吗(笔记本电池拆了直接适配器可以吗)

  • 微信中emm什么意思(微信中emmm是什么意思)

    微信中emm什么意思(微信中emmm是什么意思)

  • 网店运营是什么意思(网店运营是什么模式几乘几)

    网店运营是什么意思(网店运营是什么模式几乘几)

  • 移动魔百盒不让用无线(移动魔百盒不让看无线合理吗)

    移动魔百盒不让用无线(移动魔百盒不让看无线合理吗)

  • 谷歌商店点登录没反应(谷歌商店点登录没反应怎么解决vivo)

    谷歌商店点登录没反应(谷歌商店点登录没反应怎么解决vivo)

  • 网线没有插好如何解决(网线没插好会不会影响网速)

    网线没有插好如何解决(网线没插好会不会影响网速)

  • 小米8性能模式干嘛的(小米8性能模式在哪)

    小米8性能模式干嘛的(小米8性能模式在哪)

  • 抖音私信别人能看见吗(抖音私信别人能监控吗)

    抖音私信别人能看见吗(抖音私信别人能监控吗)

  • 手机电量显示黄颜色是什么意思(手机电量显示黄颜色怎么办)

    手机电量显示黄颜色是什么意思(手机电量显示黄颜色怎么办)

  • 抖音怎么发到个人作品(抖音怎么发到个人微信上)

    抖音怎么发到个人作品(抖音怎么发到个人微信上)

  • 华为怎么换自己的铃声(华为怎么换自己的壁纸)

    华为怎么换自己的铃声(华为怎么换自己的壁纸)

  • iphone在线是什么意思(iphone在线是在线吗)

    iphone在线是什么意思(iphone在线是在线吗)

  • 苹果11为什么充电那么慢(苹果11为什么充电时摸边上麻麻的还抖)

    苹果11为什么充电那么慢(苹果11为什么充电时摸边上麻麻的还抖)

  • 抖音里的私密怎么设置(抖音里的私密怎么看到)

    抖音里的私密怎么设置(抖音里的私密怎么看到)

  • 支付宝刷脸支付怎么去除(支付宝刷脸支付有什么风险)

    支付宝刷脸支付怎么去除(支付宝刷脸支付有什么风险)

  • 11pro 11pro max区别(11pro跟11pro max的区别)

    11pro 11pro max区别(11pro跟11pro max的区别)

  • 苹果耳机线控设置在哪(苹果耳机线控失灵怎么办)

    苹果耳机线控设置在哪(苹果耳机线控失灵怎么办)

  • 苹果手机m开头的型号是什么版本(苹果手机m开头的序列号代表什么)

    苹果手机m开头的型号是什么版本(苹果手机m开头的序列号代表什么)

  • Vue:extends继承&组件复用性(vue组件继承element并重写方法)

    Vue:extends继承&组件复用性(vue组件继承element并重写方法)

  • 帝国CMS 7.0商城系统常见问题与技巧教程分享(帝国cms8.0)

    帝国CMS 7.0商城系统常见问题与技巧教程分享(帝国cms8.0)

  • 代收车船税如何计算
  • 消费税的会计分局
  • 哪些税种属于中央固定收入
  • 销售收入是不是营业收入
  • 职工发放福利的会计处理
  • 开票金额为什么会多出一分钱
  • 合并会计报表中的未分配利润反应的是什么
  • 预缴增值税是否适用一般计税方法
  • 现金池 印花税
  • 产品保修发生的维修费计入什么科目
  • 民间非营利性组织
  • 转让部分股份流程
  • 施工单位给你钱敢领吗
  • 药店可以开具专票吗
  • 怎么查核定征收额度
  • 水利建设专项收入怎么计算
  • 企业房租收入营改增
  • 最新出口退税率调整
  • 公转私开票可以转吗
  • 一般纳税人转为小规模纳税人后还可以转为一般纳税人吗
  • Win11如何卸载microsoft edge浏览器
  • 刚成立的公司老总叫什么
  • macos big sur 怎么样
  • 公司买手机怎么做账务处理
  • 怀特岛郡国旗
  • mac 如何u盘启动
  • win11自动更新卡在94%
  • PHP:mb_strrchr()的用法_mbstring函数
  • 计提企业所得税会计分录怎么做
  • 今天端午节?
  • 压缩模制
  • 处置动产减按2%税率是什么意思
  • 前端大屏常用的输入法
  • react组件如何设置dom
  • 建设工程劳务分包合同属于建设工程合同吗
  • 爱丁堡几点天黑
  • 购买股票会计处理流程
  • 山东省项目
  • anconda虚拟环境路径
  • 元素垂直水平居中方式
  • 20年电赛c题
  • 智能优化算法可以用到哪里
  • 承包安装工程
  • 自产农产品免征个人所得税吗
  • python读取不到文件怎么办
  • vj刷题
  • 电商行业退货退款流程
  • 应付现金股利属于什么账户
  • 出售其他债权投资产生的收益为什么计入留存收益
  • 股权变更如何交税
  • 出口退税企业更正申报增值税
  • 缴纳社保公积金的会计分录
  • 主营业务成本暂估怎么算
  • 土地增值税的预缴
  • 已经认证的进项票销售方冲红了
  • 固定资产报废处理中,最终的净损益应作为
  • 单位的收入是刷卡怎么做账?
  • 发票开票服务名称
  • 投资收益怎么做帐
  • 管理费用明细科目设置和核算需要注意哪些问题
  • 公司为员工租房应注意
  • 电脑主机windows 7
  • win7系统更新软件
  • window8系统更新
  • centos设置终端快捷键
  • 内核版本能升级吗
  • information_schema翻译
  • linux sed
  • win10电源选项
  • cocos安装
  • opengl1
  • JavaScript中的变量名不区分大小写
  • css display:none使用注意事项小结
  • unity study
  • 置顶聊天的人怎么不见了
  • python快捷键大全
  • jQuery mobile的header和footer在点击屏幕的时候消失的解决办法
  • setBackgroundDrawable和setBackgroundColor的用法
  • 东莞市官网
  • 契税和个税有什么关系
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设