10

CVPR2021|CenterPoint :基于点云数据的3D目标检测与跟踪

 3 years ago
source link: https://mp.weixin.qq.com/s/-upnBN-0W1F9v2F2Pdz3VA
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

CVPR2021|CenterPoint :基于点云数据的3D目标检测与跟踪

XYunaaa 3D视觉工坊 1 week ago
计算机视觉工坊
计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
103篇原创内容
Official Account
640?wx_fmt=png
图1:网络流程图

代码、论文地址:在公众号「3D视觉工坊」,后台回复「CenterPoint」,即可直接下载。

前言:该文章是Center-based系列工作(CenterNet、CenterTrack、CenterPoint)的扩展,于2020年作者在arxiv公开了第一版CenterPoint,后续进一步将CenterPoint扩充成了一个两阶段的3D检测追踪模型,相比单阶段的CenterPoint,性能更佳,额外耗时很少。本文的主要贡献是提出了一个两阶段Center-based的目标检测追踪模型,在第一阶段(如图1中的a,b,c),使用CenterPoint检测三维目标的检测框中心点,并回归其检测框大小,方向和速度。在第二阶段(如图1中的d)设计了一个refinement模块,对于第一阶段中的检测框,使用检测框中心的点特征回归检测框的score并进行refinement。在nuScenes的3D检测和跟踪任务中,单阶段的CenterPoint效果很好,单个模型的NDS为65.5,AMOTA为63.8。模型性能很好,但是论文中说该模型的速度是在Waymo上11FPS,在nuScenes上为16FPS;同时模型的速度实验是在TiTan RTX上做的,也就是在所有边缘计算设备上均达不到实时计算。主要的Contribution:1. 使用点表示目标,简化三维目标检测任务:与图像目标检测不同,在点云中的三维目标不遵循任何特定的方向,box-based的检测器很难枚举所有的方向或为旋转的对象拟合一个轴对齐的检测框。但Center-based的方法没有这个顾虑。点没有内转角。这极大地减少了搜索空间,同时保持目标的旋转不变性。(AblationStudy的结果可以看到Center-based方法对模型效果提升非常明显)2. Center-based的方法可以简化追踪任务作者表明由于该方法不需要额外的运动模型(如Kalman滤波),所以追踪计算时间可以忽略不计,在检测的基础上仅需要运行1毫秒。3. 使用一个基于点特征的refinement模块作为网络的第二阶段。保障模型预测性能,同时也比现在大多数的refinement方法更快。我的理解是由于“检测--追踪”的多目标追踪流程对检测阶段的错误预测非常敏感,本文通过第二阶段预测bbox的score来降低CenterPoint第一阶段中产生的错误预测,提升目标检测的质量,同时进一步提升了追踪的结果。下面具体来看一下实现细节。实现细节First Stage -- CenterPoint:图二是CenterPoint的网络流程图,对应图一的a b c模块。网络的输入为雷达点云数据。网络的3D encoder部分使用了现有的网络模型,CenterPoint提供了两种主干网实现方式,分别为VoxelNet 和PointPillar。
640?wx_fmt=png
图二:CenterPoint的网络流程图网络的输出为基于类的Heatmap、目标的大小、转角和速度。其中Heatmap的生成方式与CenterNet类似。首先,我们回顾一下CenterNet热力图的回归方式:对于任意尺寸为W*H*3的图像,我们会生成一个尺寸为W/R * H/R * K的热力图,其中K是检测的类别数。热力图的中元素的取值为0或1,其中若热力图该点为1,则图像中该点是一个检测框的中心,若为0,则该出在图像中为背景。唯一的区别是:由于三维空间中目标分布离散且三维目标不会像图像中目标一样近大远小,如果按照CenterNet的方式生成Heatmap,那么Heatmap中将大部分都是背景,如图三所示。作者的解决方法是设置高斯半径公式为σ = max(f(wl); τ),其中τ = 2为最小高斯半径值,f为CenterNet的高斯半径求解方法。
640?wx_fmt=png
图三:Heatmap的局限Second Stage:根据第一阶段的目标检测框和主干网featuremap,作者提取目标检测框每个面的中心点的在featuremap上的点特征值,将该特征值送入如图一d的全连接网络中,得到该目标检测框的检测置信度和精修结果。具体地,由于目标检测框的顶面、地面的中心在birdview上为同一个点,故实际选择四个向外的面的中心在birdview上的点特征(具体的四个点的投影如图一c所示),作为全连接网络的输入值。同时,对于每个点特征,在实际提取时使用双线性插值从主干网的birdview的特征图中提取。对于score的预测:在训练时,Loss使用二进制交叉熵损失,如公式2所示,其中It为预测的置信度score,计算方式如公式1所示,表示预测结果与真值的3D IOU;在推测时,直接使用第一阶段的CenterPoint的预测结果,最终预测结果的score(Qt)求法如图4所示。其中Yt的计算方式为第一阶段的目标检测框对应的热力图上值最大的一点。It为第二阶段计算的score。Qt时Yt与It的几何平均值。640?wx_fmt=png640?wx_fmt=png
640?wx_fmt=png
图4:CenterPoint网络inference时score的计算方法实验结果检测结果基于单阶段的CenterPoint而言。如表一所示,在Waymo测试集上,CenterPoint在Level2上实现了车辆检测的71.8 mAPH和行人检测的66.4 mAPH,比之前的方法分别提高了7.1%和10.6%。如表二所示,在nuScenes上,CenterPoint比去年的挑战冠军CBGS[67]高出5.2%的mAP和2.2%的NDS。
640?wx_fmt=png
640?wx_fmt=png
追踪结果:表3显示了CenterPoint在Waymo测试集上的跟踪性能,其中AB3D是Waymo的追踪baseline。在nuScenes上(如表4),该框架比上一个挑战冠军Chiu等人的性能高出8.8 AMOTA。
640?wx_fmt=png
640?wx_fmt=png
Challenge:论文中说该模型的速度是在Waymo上11FPS,在nuScenes上为16FPS;同时模型的速度实验是在TiTan RTX上做的,也就是在所有边缘计算设备上均达不到实时计算,这应该算是本网络的一个缺点了。备注:作者也是我们「3D视觉从入门到精通」特邀嘉宾:一个超干货的3D视觉学习社区本文仅做学术分享,如有侵权,请联系删文。下载1在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。下载2在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。下载3在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

640?wx_fmt=png▲长按加微信群或投稿

640?wx_fmt=jpeg

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近3000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款640?wx_fmt=jpeg 圈里有高质量教程资料、可答疑解惑、助你高效解决问题觉得有用,麻烦给个赞和在看~640?wx_fmt=gif


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK