论文阅读笔记 | 三维目标检测——AVOD算法

article/2025/11/7 9:29:49

如有错误,恳请指出。


文章目录

  • 1. 背景
  • 2. 网络结构
  • 3. 实验结果

paper:《Joint 3D Proposal Generation and Object Detection from View Aggregation》

1. 背景

AVOD同样是一个two-stage(使用了RPN提取候选框)、anchor-based网络结构。获得较高的召回率对RPN网络来说是比较重要的,但对于稀疏的较低分辨率的输入来说(比如前视图和鸟瞰图)不足以让RPN输出高质量的候选框,且导致低召回率,这会在第二个阶段带来无法逆转的结构。基于这个考虑,AVOD设计了一个新颖的RPN结构可以通过在高分辨率特征图上进行多模态特征融合(将来自RGB图像和BEV的全分辨率特征图为输入),来提高小目标的定位精度。

补充一点,这里与MV3D的处理方法是不一样的。对于MV3D中的是对鸟瞰图的特征进行3d候选框的生成再投影回去每个模态的特征图中获得统一尺寸的roi特征图,所以本质上MV3D融合的信息较小,对于小目标来说检测精度较低。而AVOD采取的方案是利用投影在RGB图与BEV全尺寸的特征图上获取feature crop融合来进行最后边界框的预测,在下面网络结构中会详细介绍。


2. 网络结构

AVOD的网络结构图如下所示。对于BEV输入表示采用与MV3D类似的方式,截取的点云范围是[-40,40]x[0,70],以包含RGB图像视野的点。BEV输入包含6个channel,其中前5个是切片的高度特征(沿z轴0.5m进行切片,提取网格中的最高点),第6个channel是密度特征(网格内的点密度)。
在这里插入图片描述

对于点云这种稀疏数据来说,如果对BEV进行8x下采样卷积提取特征,那么一个0.8x0.6m的行人在0.1m采样下,原本是8x6的像素,而在下采样后的特征图中像素点可能不足1。对于这种情况,需要提高特征图尺寸,这里AVOD使用Encoder-Decoder类似U-Net的结构来对特征进行反卷积到原始大小(如下所示),构建了一个point-wise的特征图。对于BEV和RGB数据,通过这种方式分别构建成BEV特征图以及RGB特征图。
在这里插入图片描述

现在,对BEV图的坐标点以0.5米精度进行间隔采样生成3d锚框网格(3d anchor grid),3d的先验框尺寸通过对真实目标框进行聚类获取。锚框由中心点(tx,ty,tz)以及相对尺寸(dx,dy,dz)进行参数设定,如下图所示的Axis Aligned方法所示。此外,可以通过计算积分图像去除BEV中没有3d点的anchor,以此减少计算量。
在这里插入图片描述

基于BEV采样所获得的3d anchor投影到BEV和RGB上,获得这两个特征图上的感兴趣区域。将此区域截取出来,进行双线性插值变化到3x3的相同大小,随后进行element-wise mean操作融合,再通过全连接构建一组预测参数来生成proposal。输出包括objectness以及回归参数(∆tx,∆ty,∆tz,∆dx,∆dy,∆dz),既回归是通过anchor和ground truth之间的质心和尺寸差异来进行回归。在BEV视图上进行正负样本的判定,iou<0.3是负样本,iou>0.5的正样本。最后通过nms挑选前1024个anchor作为3d proposals。

获得了3d proposals将其投影回去BEV与RGB视图中获得对应区域的feature map,同样的对来自BEV与RGB的两个feature crop进行resize到7x7的大小进行element-wise融合,随后用过3层2048的全连接层进行特征编码。在这个阶段的proposals编码方式采取的是4 Corners+Height,也就是底部的4个角点以及两个高度来对真实框进行回归。这种方式考虑到了3d边界框的物理约束,无需强迫顶角与底角的对齐,减少物理信息的冗余性。所以,4个点的(x,y)位置以及2个高度,特征编码的输出维度由8角点(corner loss)的24维度缩减到了10维度。

损失组成同样有分类损失(cross-entropy loss)以及这种4角点+2高度的定位回归损失(Smooth L1 losses)所构成。这里对car类别BEV视图上iou>0.65是正样本,而pedestrian/cyclist类别只需要iou>0.55。


3. 实验结果

实验结果表明,对于AVOD来说,对BEV和RGB进行反卷积到原尺寸构建高分辨率的特征图有极大帮助,尤其是行人这种小目标,提升效果10%。而本质上,这种反卷积到原始尺寸已经可以作为一个语义分割的任务处理,那么可不可以推断出语义分割网络结构性能提升,提取到这种pixel-wise的强语义特征,在一定程度上也有助于检测任务的性能。
在这里插入图片描述

AVOD对框回归设计了新的回归方法,但是这里并没有对另外两种回归方法(8 Corner、Axis Aligned)进行对比实验,并没有否定添加8 Corner会对精度有提升。此外,基于原尺寸的特征图截取feature crop局部特征有助于小目标的定位检测,整体效果均有提升,这个idea可以在后续处理中保留。



http://chatgpt.dhexx.cn/article/bFOlHgph.shtml

相关文章

IC授权卡和复制卡的区别_信用卡小知识【芯片卡磁条卡的区别】

各位老板&#xff0c;企业家大家好&#xff0c;我是小胡&#xff0c;您身边的金融专家。 今天呢跟大家说一下信用卡芯片卡和磁条卡的区别&#xff1f; 信用卡呢&#xff0c;现在普及率非常高的。几乎是人手一张或者是多张。那么大家知道芯片卡和磁条卡的区别到底在哪里&#xf…

IC卡清卡软件的使用

IC卡清卡软件&#xff0c;可以在知道卡片密码的情况下&#xff0c;把卡片恢复出厂密码&#xff0c;清除卡片数据和密码。 如下图 然后读取卡片文件&#xff0c;即卡片dump文件&#xff0c; 然后把卡片放读写器上&#xff0c;点清卡按钮&#xff0c;开始清卡&#xff0c;将清除…

门禁 IC卡 和 ID卡初步了解

目录 一、常用卡介绍 二、复制加密IC卡 1. 工具 2. 方法 3. 最简单的办法 三、IC卡种类介绍 1、接触型IC卡 2、非接触型IC卡 3、串行传输型IC卡 4、并行传输型IC卡 5、存储型IC卡(Memory Card) 6、加密存储型IC卡(Memory Card With Security Logic) 7、智能…

@芯片IC卡也能被复制?冒名卡/克隆卡分分钟复制完成【威 要器妖酒寺起舞酒久吧尔救】

去年底&#xff0c;广西贺州法院审理了一起未成年人盗刷校园IC卡案。被告廖某将已充值的校园IC卡信息复制到另一张空白卡上&#xff0c;在校园内的食堂、超市等进行刷卡消费。并将此方式传给另外4名同乡伙伴&#xff0c;5人共计非法盗刷2万多元。 网购工具 操作简单 据被告廖某…

ID卡复制教程(使用T5577卡复制4100卡)

1 ID卡的常见类型与区别 国内常见的普通ID卡多为EM 4100 或 EM 4102卡&#xff0c;其特点是不可修改ID号。为了复制普通ID卡&#xff0c;通常采用T5577 或 EM4305卡&#xff08;俗称ID白卡&#xff09;&#xff0c;其特点是内部EEPROM可读可写&#xff0c;修改卡内EEPROM的内容…

教程:利用艾斯PM3GUI软件助手,帮你查IC卡漏洞

测试目的&#xff1a;检查身边的IC卡是否有技术漏洞&#xff08;门禁卡&#xff0c;会员卡&#xff09; 测试软件&#xff1a;艾斯PM3GUI软件助手2022版&#xff08;IC卡信息安全专家&#xff09;测试设备&#xff1a;PM3easy 优化增强版测试环境&#xff1a;Windows10 我们先拿…

华为手机NFC功能,教你一键复制各种卡

日常生活中&#xff0c;我们经常会携带各种卡&#xff0c;比如&#xff1a;公交卡、门禁卡、银行卡等&#xff0c;但是有时候忘记带了怎么办&#xff1f;或者带了却丢失了。 很多人都知道NFC功能支持充值公交卡&#xff0c;但是它的其他作用你还知道多少个&#xff0c;这期小编…

IC授权卡和复制卡的区别_北京居住证跟居住卡的区别

北京市居住证是小伙伴们在北京居住、作为常住人口享受基本公共服务和便利、通过积分申请登记常住户口的证明。持有居住证就是在京享受基本公共服务和便利的基础,居住登记卡是申领居住证的基础。按照北京市相关规定,在到达北京3日内,小伙伴应主动申报暂住登记,领取居住登记卡…

蓝牙卡复制html,车库蓝牙卡能复制吗

现在小区为了业主小车的安全会在车库上安装门禁系统。那么车库蓝牙卡能复制吗?车库蓝牙卡怎么复制呢&#xff1f;下面就跟着小编一起来看看吧&#xff01; 车库蓝牙卡能复制吗&#xff1a; 车库蓝牙卡能复制&#xff0c;价格一般在30-60元左右&#xff0c;复制的蓝牙卡与原版外…

普通门禁卡及各类复制卡相关知识

转自&#xff1a; https://nfctool.cn/42 本文带你了解M1卡的数据结构&#xff0c;为以后的破解提供理论基础。同时带你了解各种IC卡&#xff0c;让你对破解和复制有更清晰的目标。请注意&#xff0c;ID卡没有密码&#xff0c;一读一写即可复制&#xff0c;手机手环不能模拟ID卡…

IC卡与ID卡

IC卡与ID卡定义 IC卡全称集成电路卡&#xff08;Integrated Circuit Card&#xff09;&#xff0c;又称智能卡&#xff08;Smart Card&#xff09;它是将一个微电子芯片嵌入符合ISO 7816标准的卡基中&#xff0c;做成卡片形式&#xff0c;芯片含的存储器&#xff08;ROM、EEPR…

IC授权卡和复制卡的区别_一起来了解苹果礼品卡的区别,解决你购买时的困惑...

要说到现在过节送什么,除了日常的烟、酒之外。Apple礼品卡也是不少年轻人的选择。但是,如果您去购买Apple礼品卡,您会很快发现事情变得有些混乱。因为有多种Apple礼品卡可供选择,它们的名称各不相同,作用也是不同,为了解决你的困惑,我们一起来了解一下Apple礼品卡的区别…

Python 读写IC卡、复制IC卡

本示例使用的发卡器&#xff1a;https://item.taobao.com/item.htm?spma1z10.5-c.w4002-17663462238.11.3614789e318TMs&id615391857885https://item.taobao.com/item.htm?spma1z10.5-c.w4002-17663462238.11.3614789e318TMs&id615391857885 #python通过缩进来表示代…

IC卡防批量复制破解 Mifare卡一卡一密方案说明 门禁卡校园卡水卡会员卡防破解方案

目前市面上大部分的IC卡&#xff08;如门禁卡&#xff0c;门锁卡&#xff0c;水卡&#xff0c;校园卡&#xff0c;会员卡等&#xff09;均属于Mifare1S50卡。该类卡片虽然在采购价格上较有优势&#xff0c;但同时也存在被批量破解、复制等安全性风险。如果更换为CPU卡&#xff…

php ic卡,IC卡的数据结构认识

讲解一下滚动码&#xff1a; 滚动码是一种防复制的技术&#xff0c;判断滚动码的方法非常的简单。 拿到物业发的原卡先解密&#xff0c;解密后数据保存。保存完成之后&#xff0c;拿着你的物业卡原卡去刷一下电梯或者门禁。然后再回来对比一下数据。看下刷电梯前的数据和刷电梯…

IC卡分类

M1 普通IC卡&#xff0c;0扇区不可以修改&#xff0c;其他扇区可反复擦写。我们日常碰到的单位食堂卡&#xff0c;小区门禁卡&#xff0c;单元的电梯卡都使用的是M1卡。 UID卡 所有区块可被重复读写 卡片ID可改写且使用后门指令更改ID 卡片ID可重复修改 相应后门指令&#xff…

使用ACR122U和Proxmark3复制IC卡

常见IC卡片介绍及使用ACR122U和Proxmark3复制卡方法 一、常见IC卡片介绍 1.1 ID卡和IC卡 ID卡&#xff1a;全称身份识别卡(Identification Card)&#xff0c;多为低频(125Khz)&#xff0c;是一种不可写入的感应卡&#xff0c;含固定的编号&#xff0c;主要有台湾SYRIS的EM格…

Delphi 复制IC卡写UID卡0区0块

本示例使用的发卡器&#xff1a;https://item.taobao.com/item.htm?spma1z10.5-c.w4002-17663462238.11.7154789eKODONP&id615391857885https://item.taobao.com/item.htm?spma1z10.5-c.w4002-17663462238.11.7154789eKODONP&id615391857885 unit declaredll;interf…

PN532模块复制IC加密卡

PN532模块复制IC加密卡 忍受够了每天都需要带着各种各样的卡片&#xff0c;如果可以将卡复制进手机里&#xff0c;那我就可以只带着手机&#xff0c;每天出门都是轻装上阵。 只要你的手机拥有nfc功能&#xff0c;那你可以直接将卡模拟进手机里&#xff0c;当然这样并没有完全…

IC卡、ID卡及车库蓝牙卡的复制说明!(小区的门禁系统)

随着科技的发展&#xff0c;各种新的技术也不断的出现&#xff0c;如现在很多的小区物业管理和其它一些关于关卡出入的管理方面都采取了门禁卡的形式&#xff0c;若是门禁卡丢失了&#xff0c;那么可能会被物业管理公司几倍的罚款&#xff0c;为了避免这种情况的出现&#xff0…