avod论文理解与代码解读

article/2025/11/7 6:55:14

AVOD 论文理解与代码解读

  • 论文简析
    • 概述
    • 网络结构
      • BEV map
      • 特征提取
      • rpn 网络
      • 特征融合
    • 第二阶段检测网络
      • box 编码
      • 方向确定
    • 代码解读
      • anchor 的产生
      • mini batch的产生与作用
      • rpn model
      • avod model
      • loss
      • 不足

论文简析

参考文章:
csdn

代码:
代码
文献:
论文

概述

这篇论文的特点是多数据融合。自动驾驶领域对安全性的要求更加严格,这对检测的准确性要求很高。多数据的融合提供了更多的信息,相对的检测能力更好一些。avod网络以雷达点云数据生成BEV map和image作为输入,经过特征提取成两个相应的feature map,通过anchor的映射融合两个特征图,经过rpn网络产生non-oriented region proposals,(事实上rpn网络只对class和bounding box进行回归)
将这些proposals送入子网络second stage detector network产生精确的有方向的3D bounding boxs,完成3D物体的检测。网络结构如下:
avod 网络结构图

网络结构

BEV map

将点云数据处理成6channel BEV map.在水平面上分辨率为0.1,选取[-40, 40]x[0, 70]范围的点处理成700x800的BEV map.在竖直方向上选取[0, 2.5]平分为五段,这样就将点云数据划分成700x800x5的体素。然后在每个体素中提取高度信息,在整体的700x800的图上提取整体密度信息。最终构成700x800x6的BEV map.但是感觉所提特征不明显,对结果有很大的影响。
如图:
BEV map

特征提取

avod 为了提高小目标物体的检测准确率,采用FPN的想法,得到全分辨的feature map送入rpn网络。如图:
fpn 特征提取网络

rpn 网络

1.anchors以6参数形式表示。(tx, ty, tz)表示中心点,(dx, dy, dz)表示三个轴的尺寸。在BEV上以0.5米的间距采样(tx, ty), tz由传感器与地面间的距离等因素决定。anchors的大小由训练样本数据而得(怎么确定暂时没看,应该类似最近邻的方式统计出来的吧,也可以自己设定一个固定预设值,类似faster rcnn)。  
2.rpn的loss计算分为两部分:
类别loss: 采用交叉熵loss.
box regression loss: 采用smooth L1 loss.
3.在BEV上通过判定anchors与ground truth的IoU分辨object/background,在BEV上采用2D NMS将top k proposals 送入第二阶段检测网络。

特征融合

每个3D anchor投影到BEV以及image获得两个roi,每个roi进行resized to 3x3然后进行像素级别的特征融合。

第二阶段检测网络

全连接层得到类别,bounding box,方向的回归。

box 编码

本文采用4corner + 2 height offset方式编码,利用3D举行框顶点对齐的几何限制减少参数并利用物体与ground plane的偏移,得到更精确的定位。回归形式是( ∆x1…∆x4,∆y1…∆y4, ∆h1, ∆h2)。实现中的ground plane参数为4个系数,ax+by+cz+d=0确定的平面。box表示形式如图:box 表示方式

方向确定

avod采用regressed orientation vector以及计算(cos(ry),sin(ry)),可以由BEV平面的唯一单位向量表示。每个bounding box有四个可能的朝向,选取离regressed orientation vector最近的朝向。

代码解读

anchor 的产生

根据得到的cluster的每个尺寸产生两个方向的anchor。最终的anchor数量计算为70x80/0.5/0.5x(num_cluster)*2.源码中num_cluster为2,这样anchor的总数量为89600个。即每幅图产生89600个anchor。
在这里插入图片描述
在这里插入图片描述

mini batch的产生与作用

gen_mini_batches.py 会利用生成的anchors与gt来生成最终输入网络的信息。开始生成的anchors总共有89600,去除掉空的anchors,大约在8k到15k之间。然后用剩下的这些anchors与gt计算iou,最终iou大于0的大约150(只有一个gt的大致结果)。这个结果与论文不符,不知道自己哪理解的有问题。附上论文介绍:
在这里插入图片描述
最终产生的文件在文件夹mini_batches中。具体信息为:
shape:(N, 9)
index: anchors的序號
iou: anchors 与gt的iou.
offset(6个): anchor与gt的共同结果,计算公式如下:
t_x_gt = (x_gt - x_anch)/dim_x_anch
t_y_gt = (y_gt - y_anch)/dim_y_anch
t_z_gt = (z_gt - z_anch)/dim_z_anch
t_dx_gt = log(dim_x_gt/dim_x_anch)
t_dy_gt = log(dim_y_gt/dim_y_anch)
t_dz_gt = log(dim_z_gt/dim_z_anch)
class_index:每种object类别对应的数值,例如 car:1
另外:这个过程中可以设置类别,难度等的设置。这样数据的好坏有个分类,这样比较更加细致一些。

rpn model

这个网络主要是利用数据预处理的anchors与label进行粗预测,检测出rois.这些rois很可能是需要检测的区域。这一块利用了anchor来进行点云与图像数据的融合。生成的rois用于下一阶段的融合与检测。

avod model

利用rpn_model生成的rois来进行数据融合与检测。

loss

包括定位,类别,方向预测。

不足

1.我觉得这篇论文对点云的处理不够细致,提取的特征不足。
2.整体的网络也很平常,没有对与小物体的优化处理,网络结构可以更加丰富一些。
3.loss可以更优化一些。


http://chatgpt.dhexx.cn/article/6sclUcMJ.shtml

相关文章

AVOD、SVOD、TVOD、PVOD:视频点播商业模式

翻译、编辑:Alex 本文来自OTTVerse,作者为Krishna Rao Vijayanagar。 ▲扫描图中二维码了解音视频技术大会更多信息▲ Easy-Tech #025# 什么是视频点播(VOD)? 当我向流媒体业内人士问到,视频点播&#x…

【综述】MV3D-Net、AVOD-Net 用于自动驾驶的多视图3D目标检测网络

点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 前言 MV3D-Net 融合了视觉图像和激光雷达点云信息;输入数据有三种,分别是点云俯视图、点云前视图和RGB图像。通过特征提取、特征整合和特征融合,最终得到类别标签、3D边界框…

AVOD、SVOD、TVOD、PVOD:揭秘视频点播商业模式

点击上方“LiveVideoStack”关注我们 翻译、编辑:Alex 本文来自OTTVerse,作者为Krishna Rao Vijayanagar。 ▲扫描图中二维码或点击阅读原文▲ 了解音视频技术大会更多信息 商业模式 Easy-Tech #025# 什么是视频点播(VOD)&#xf…

AVOD:点云数据与BEV图的处理及可视化

文章目录 前言1. 点云数据可视化2. 点云数据校准3. 转为BEV图4. 补充:点云坐标系与相机坐标系结束语 前言 本篇主要记录对AVOD代码的学习与理解,主要是KITTI数据集中3D Object Detection任务中的点云数据和BEV图的处理,为方面理解其中的操作&…

视觉与激光雷达融合3D检测(一)AVOD

1.概述 AVOD(Aggregate View Object Detection)和MV3D类似,是一种融合3维点云和相机RGB图像的三维目标检测算法. 不同的是: MV3D中融合了相机RGB图像,点云BEV映射和FrontView映射,而AVOD则只融合相机RGB图像和点云BEV映射. 从网络结果来看,AVOD采用了基…

AVOD论文解读

AVOD论文解读 1.概述2.网络框架2.1 激光点云数据预处理2.2 特征提取2.3 降低数据量2.4 3D后选区域生成2.5 3D检测框编码2.6 朝向估计 论文地址:[1712.02294] Joint 3D Proposal Generation and Object Detection from View Aggregation (arxiv.org) 代码地址&#…

AVD的使用

前言:这个是AndroidStudio自带的模拟器,虽然功能强大,但是感觉不太好用,安装和使用都比较卡。 个人推荐使用夜神模拟器。 1.打开AndroidStudio,并新建一个工程 2.在菜单栏选择Tools-Android-AVDManager--Create Virt…

复现AVOD

复现过程主要参考https://zhuanlan.zhihu.com/p/87136172 这位博主 之前跟着官方github(https://github.com/kujason/avod) 环境一直配置不好,之后直接使用博主提供的yaml配置文件,之后进行略微调整即可 与博主不同的是&#xf…

AVOD-理解系列(一)

AVOD-理解 本篇用于记载之前阅读的论文avod及其代码,纯属个人个人理解.有误之处欢迎指正! 网络结构 代码流程 1:Feed_dict: feed_dict: 主要就是确定每一个mini_batch里输入图像的各种信息,包括图像的名字,图像的标签文件,图像…

AVOD代码复现

参考文献: https://zhuanlan.zhihu.com/p/86340957 https://zhuanlan.zhihu.com/p/354842740 https://www.guyuehome.com/39798 https://zhuanlan.zhihu.com/p/40271319 1,配置环境 conda create -n avod python3.5 conda install tensorflow-gpu1.3.0…

三十三.智能驾驶之多传感器融合技术: AVOD融合方法

AVOD(Aggregate View Object Detection)和MV3D类似,是一种融合3维点云和相机RGB图像的三维目标检测算法. 不同的是: MV3D中融合了相机RGB图像,点云BEV映射和FrontView映射,而AVOD则只融合相机RGB图像和点云BEV映射. 从网络结果来看,AVOD采用了基于两阶的…

AVOD论文和代码解析

1.介绍 AVOD(Aggregate View Object Detection)算法和MV3D算法在思路上非常相似,甚至可以说,AVOD是MV3D的升级版本 总的来说,和MV3D相比,AVOD主要做了以下一些改进: (1&#xff0…

论文阅读笔记 | 三维目标检测——AVOD算法

如有错误,恳请指出。 文章目录 1. 背景2. 网络结构3. 实验结果 paper:《Joint 3D Proposal Generation and Object Detection from View Aggregation》 1. 背景 AVOD同样是一个two-stage(使用了RPN提取候选框)、anchor-based网络结构。获得较高的召回率…

IC授权卡和复制卡的区别_信用卡小知识【芯片卡磁条卡的区别】

各位老板,企业家大家好,我是小胡,您身边的金融专家。 今天呢跟大家说一下信用卡芯片卡和磁条卡的区别? 信用卡呢,现在普及率非常高的。几乎是人手一张或者是多张。那么大家知道芯片卡和磁条卡的区别到底在哪里&#xf…

IC卡清卡软件的使用

IC卡清卡软件,可以在知道卡片密码的情况下,把卡片恢复出厂密码,清除卡片数据和密码。 如下图 然后读取卡片文件,即卡片dump文件, 然后把卡片放读写器上,点清卡按钮,开始清卡,将清除…

门禁 IC卡 和 ID卡初步了解

目录 一、常用卡介绍 二、复制加密IC卡 1. 工具 2. 方法 3. 最简单的办法 三、IC卡种类介绍 1、接触型IC卡 2、非接触型IC卡 3、串行传输型IC卡 4、并行传输型IC卡 5、存储型IC卡(Memory Card) 6、加密存储型IC卡(Memory Card With Security Logic) 7、智能…

@芯片IC卡也能被复制?冒名卡/克隆卡分分钟复制完成【威 要器妖酒寺起舞酒久吧尔救】

去年底,广西贺州法院审理了一起未成年人盗刷校园IC卡案。被告廖某将已充值的校园IC卡信息复制到另一张空白卡上,在校园内的食堂、超市等进行刷卡消费。并将此方式传给另外4名同乡伙伴,5人共计非法盗刷2万多元。 网购工具 操作简单 据被告廖某…

ID卡复制教程(使用T5577卡复制4100卡)

1 ID卡的常见类型与区别 国内常见的普通ID卡多为EM 4100 或 EM 4102卡,其特点是不可修改ID号。为了复制普通ID卡,通常采用T5577 或 EM4305卡(俗称ID白卡),其特点是内部EEPROM可读可写,修改卡内EEPROM的内容…

教程:利用艾斯PM3GUI软件助手,帮你查IC卡漏洞

测试目的:检查身边的IC卡是否有技术漏洞(门禁卡,会员卡) 测试软件:艾斯PM3GUI软件助手2022版(IC卡信息安全专家)测试设备:PM3easy 优化增强版测试环境:Windows10 我们先拿…

华为手机NFC功能,教你一键复制各种卡

日常生活中,我们经常会携带各种卡,比如:公交卡、门禁卡、银行卡等,但是有时候忘记带了怎么办?或者带了却丢失了。 很多人都知道NFC功能支持充值公交卡,但是它的其他作用你还知道多少个,这期小编…