AVOD-理解系列(一)

article/2025/11/7 9:00:25

AVOD-理解

本篇用于记载之前阅读的论文avod及其代码,纯属个人个人理解.有误之处欢迎指正!

网络结构

这里写图片描述

代码流程

1:Feed_dict:

feed_dict: 主要就是确定每一个mini_batch里输入图像的各种信息,包括图像的名字,图像的标签文件,图像的
ground-plane,以及点云的信息,相机的标定信息.

图像: 图像是随机打乱输入的,每次需要获取的是图像的名字,使用时根据图像的名字得到图像的相应文件,包括
.png,.npy,plane,calib等文件,分别存储着这张图片的image信息,点云信息,地平线,相机标定参数

Anchors_info: 这个信息存储在.npy文件里面,anchor_indices=anchors_info[:,0],anchors_ious=anchors_info[:,1],
anchors_offsets=anchors_info[:,2:8],anchors_class=anchors_info[:,8].注意:anchors_info=np.load(file_name)

标签信息:从.txt文件里面读取出来的,一共有15个参数:2D标签坐标(x1,y1,x2,y2).3D标签坐标(tx,ty,tz,h,w,l)中心点坐标与长宽高.同时需要根据要求删除某些标签,比如在只训练car时就要去除person和cyclist的标签.

其它信息:分别取得相应的ground plane(一个平面方程:aX+bY+cZ=d),相机标定参数包括内外参数,以及点云([x,….],[y,…],[z,…])

对图像的一些处理: 比如是否翻转,是否加抖动(噪声)

创建BEV-images: bev输入的输入是六个通道的参数,前五个是五个slice的每个像素点的最高点的值,最后一个是这个像素点的点密度.notes:这个创建images时输入的是point,plane,以及一些设定参数:voxel_size:0.1,area_extent:[-40,40,-5,3,0,70].在这里还有一些细节没有看明白,它有一个操作是要去除某些点的,然而我不是很理解它去除的究竟是哪些区域的点.留个疑问!

2:input->feature-map

Input:

Image input不必说.BEV input 在点云数据里,高度上在0-2.5内进行划分,均分为5个片段,在鸟瞰图上每0.5米的高度记录一次,鸟瞰图的输入的前5个channels是这5个channel(在长和宽的像素上每一个删格)的点的最高值,最后一个channel是该删格位置上的点的密度.

feature-map:

对两个输入使用同样的卷积网络进行卷积提取特征(VGG网络,只要前4层),4层卷积后图像变为原始图像的1/8大小,为了防止特征图过小而导致对小物体的检测效果不好,对卷积后的图进行上采样(官方代码用的是双线性插值法,实际的输出feature map是原始图像的一半?),两个输入都需要同样的操作.

3:feature map-> NMS

feature-map:

从输入进来的feature map进行1*1的卷积后,再对其size进行裁剪,使其大小为6*6.注意:因为训练时path_drop_probability等于0.9,所以在此之前需要随机选择该图像是否输入,生成mask来控制.同时mask的值也将会作为之后融合网络的参数.size:(1/2):(1/2):1

Fusion:

Fusion网络实际就是将两个图像re-size后的feature-map进行平均相加.如果某一个图像的mask为0,则该图像不需要输入,fusion网络就只输出mask为1的那个feature map.

Fully connection:

全连接网络在实际时使用了卷积网络代替全连接层.分为两大部分:背景/物体分类得分,以及框回归(dtx,dty,dtz,dw,dh,dl)中心点回归与长宽高回归.

Proposals->NMS:

Proposals:

对原始手动输入的3D-anchors利用框回归得到的offsets(6)计算回归后的框(预测),并将其投影到BEV图上,计算在鸟瞰图上的框的坐标以及norm后的坐标((x1,z1,x2,z2)左上角与右下角的坐标).注意:y轴方向代表的才是高度!并且似乎负方向才表示高度的正方向?还有一个问题就是不明白为什么会有在负向坐标的点?

NMS:

Soft-max后的分类输出得分使用NMS,即针对在BEV图上的norm后的框回归值,利用soft max的值,选取得分最大的作为gt,当anchors与gt的ious大于0.5时就保留该anchors,最大保留1024个anchors.取出相对应的NMS后的top_anchors与top_objectness_softmax

第一次写博客,这个编辑器不会用(果然我就适合搞个word来,简单有方便,可惜这个博客不让直接传word格式的.允悲).暂时不想附上代码解析.就这样看吧

修改了一处错误


http://chatgpt.dhexx.cn/article/6E1Zdf6D.shtml

相关文章

AVOD代码复现

参考文献: https://zhuanlan.zhihu.com/p/86340957 https://zhuanlan.zhihu.com/p/354842740 https://www.guyuehome.com/39798 https://zhuanlan.zhihu.com/p/40271319 1,配置环境 conda create -n avod python3.5 conda install tensorflow-gpu1.3.0…

三十三.智能驾驶之多传感器融合技术: AVOD融合方法

AVOD(Aggregate View Object Detection)和MV3D类似,是一种融合3维点云和相机RGB图像的三维目标检测算法. 不同的是: MV3D中融合了相机RGB图像,点云BEV映射和FrontView映射,而AVOD则只融合相机RGB图像和点云BEV映射. 从网络结果来看,AVOD采用了基于两阶的…

AVOD论文和代码解析

1.介绍 AVOD(Aggregate View Object Detection)算法和MV3D算法在思路上非常相似,甚至可以说,AVOD是MV3D的升级版本 总的来说,和MV3D相比,AVOD主要做了以下一些改进: (1&#xff0…

论文阅读笔记 | 三维目标检测——AVOD算法

如有错误,恳请指出。 文章目录 1. 背景2. 网络结构3. 实验结果 paper:《Joint 3D Proposal Generation and Object Detection from View Aggregation》 1. 背景 AVOD同样是一个two-stage(使用了RPN提取候选框)、anchor-based网络结构。获得较高的召回率…

IC授权卡和复制卡的区别_信用卡小知识【芯片卡磁条卡的区别】

各位老板,企业家大家好,我是小胡,您身边的金融专家。 今天呢跟大家说一下信用卡芯片卡和磁条卡的区别? 信用卡呢,现在普及率非常高的。几乎是人手一张或者是多张。那么大家知道芯片卡和磁条卡的区别到底在哪里&#xf…

IC卡清卡软件的使用

IC卡清卡软件,可以在知道卡片密码的情况下,把卡片恢复出厂密码,清除卡片数据和密码。 如下图 然后读取卡片文件,即卡片dump文件, 然后把卡片放读写器上,点清卡按钮,开始清卡,将清除…

门禁 IC卡 和 ID卡初步了解

目录 一、常用卡介绍 二、复制加密IC卡 1. 工具 2. 方法 3. 最简单的办法 三、IC卡种类介绍 1、接触型IC卡 2、非接触型IC卡 3、串行传输型IC卡 4、并行传输型IC卡 5、存储型IC卡(Memory Card) 6、加密存储型IC卡(Memory Card With Security Logic) 7、智能…

@芯片IC卡也能被复制?冒名卡/克隆卡分分钟复制完成【威 要器妖酒寺起舞酒久吧尔救】

去年底,广西贺州法院审理了一起未成年人盗刷校园IC卡案。被告廖某将已充值的校园IC卡信息复制到另一张空白卡上,在校园内的食堂、超市等进行刷卡消费。并将此方式传给另外4名同乡伙伴,5人共计非法盗刷2万多元。 网购工具 操作简单 据被告廖某…

ID卡复制教程(使用T5577卡复制4100卡)

1 ID卡的常见类型与区别 国内常见的普通ID卡多为EM 4100 或 EM 4102卡,其特点是不可修改ID号。为了复制普通ID卡,通常采用T5577 或 EM4305卡(俗称ID白卡),其特点是内部EEPROM可读可写,修改卡内EEPROM的内容…

教程:利用艾斯PM3GUI软件助手,帮你查IC卡漏洞

测试目的:检查身边的IC卡是否有技术漏洞(门禁卡,会员卡) 测试软件:艾斯PM3GUI软件助手2022版(IC卡信息安全专家)测试设备:PM3easy 优化增强版测试环境:Windows10 我们先拿…

华为手机NFC功能,教你一键复制各种卡

日常生活中,我们经常会携带各种卡,比如:公交卡、门禁卡、银行卡等,但是有时候忘记带了怎么办?或者带了却丢失了。 很多人都知道NFC功能支持充值公交卡,但是它的其他作用你还知道多少个,这期小编…

IC授权卡和复制卡的区别_北京居住证跟居住卡的区别

北京市居住证是小伙伴们在北京居住、作为常住人口享受基本公共服务和便利、通过积分申请登记常住户口的证明。持有居住证就是在京享受基本公共服务和便利的基础,居住登记卡是申领居住证的基础。按照北京市相关规定,在到达北京3日内,小伙伴应主动申报暂住登记,领取居住登记卡…

蓝牙卡复制html,车库蓝牙卡能复制吗

现在小区为了业主小车的安全会在车库上安装门禁系统。那么车库蓝牙卡能复制吗?车库蓝牙卡怎么复制呢?下面就跟着小编一起来看看吧! 车库蓝牙卡能复制吗: 车库蓝牙卡能复制,价格一般在30-60元左右,复制的蓝牙卡与原版外…

普通门禁卡及各类复制卡相关知识

转自: https://nfctool.cn/42 本文带你了解M1卡的数据结构,为以后的破解提供理论基础。同时带你了解各种IC卡,让你对破解和复制有更清晰的目标。请注意,ID卡没有密码,一读一写即可复制,手机手环不能模拟ID卡…

IC卡与ID卡

IC卡与ID卡定义 IC卡全称集成电路卡(Integrated Circuit Card),又称智能卡(Smart Card)它是将一个微电子芯片嵌入符合ISO 7816标准的卡基中,做成卡片形式,芯片含的存储器(ROM、EEPR…

IC授权卡和复制卡的区别_一起来了解苹果礼品卡的区别,解决你购买时的困惑...

要说到现在过节送什么,除了日常的烟、酒之外。Apple礼品卡也是不少年轻人的选择。但是,如果您去购买Apple礼品卡,您会很快发现事情变得有些混乱。因为有多种Apple礼品卡可供选择,它们的名称各不相同,作用也是不同,为了解决你的困惑,我们一起来了解一下Apple礼品卡的区别…

Python 读写IC卡、复制IC卡

本示例使用的发卡器:https://item.taobao.com/item.htm?spma1z10.5-c.w4002-17663462238.11.3614789e318TMs&id615391857885https://item.taobao.com/item.htm?spma1z10.5-c.w4002-17663462238.11.3614789e318TMs&id615391857885 #python通过缩进来表示代…

IC卡防批量复制破解 Mifare卡一卡一密方案说明 门禁卡校园卡水卡会员卡防破解方案

目前市面上大部分的IC卡(如门禁卡,门锁卡,水卡,校园卡,会员卡等)均属于Mifare1S50卡。该类卡片虽然在采购价格上较有优势,但同时也存在被批量破解、复制等安全性风险。如果更换为CPU卡&#xff…

php ic卡,IC卡的数据结构认识

讲解一下滚动码: 滚动码是一种防复制的技术,判断滚动码的方法非常的简单。 拿到物业发的原卡先解密,解密后数据保存。保存完成之后,拿着你的物业卡原卡去刷一下电梯或者门禁。然后再回来对比一下数据。看下刷电梯前的数据和刷电梯…

IC卡分类

M1 普通IC卡,0扇区不可以修改,其他扇区可反复擦写。我们日常碰到的单位食堂卡,小区门禁卡,单元的电梯卡都使用的是M1卡。 UID卡 所有区块可被重复读写 卡片ID可改写且使用后门指令更改ID 卡片ID可重复修改 相应后门指令&#xff…