引导方法深度补全系列—晚期融合模型—1—《Dense depth posterior (ddp) from single image and sparse range》文章细读

article/2025/10/19 15:10:21

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

目录

创新点

实施细节

对比sparse_RGBD

tips

方法详解

损失函数

优缺点

总结


创新点

1.提出了基于贝叶斯理论的两步法网络做深度补全


文章概述

       提出了两步法,实际上关键是先验模型,结合假设深度图d下观察到的稀疏点云z的可能性模型计算的,为了得出后验概率,并由此得出基准评估深度图的最大后验概率(MAP)估计:

1.我们没有为稀疏输入使用专门设计的层,例如稀疏不变层。

2.与稀疏深度和图像的早期融合不同,我们的深度将融合推迟到解码,这需要更少的可学习参数

3.使用的还是resnet

实施细节

1.我们通过用密集深度图替换编码分支的输入来修改CPN[36]的公共实现。两个分支的融合只是编码的串联。编码器只有卷积层,而解码器由用于上采样的转置卷积层组成

2.学习后,我们将CPN作为训练损失的一部分,在推理过程中不需要它

3.使用虚拟KITTI数据集[11]训练CPN

4.使用张量流实现了我们的方法。我们使用Adam优化我们的网络,使其具有与CPN训练相同的批量大小和学习速率调度。我们应用直方图均衡,并将图像随机裁剪到768×320。此外,我们还应用了垂直和水平随机翻转来防止过度拟合。在无监督训练的情况下,我们还在3×3邻域内对稀疏深度输入和相应的有效性映射执行随机移位。

5.有监督方法变为无监督方法时,改变了网络结构,我们将第一层的步长从1更改为2,并用最近邻上采样替换解码器的最后一层。

对比sparse_RGBD

1.他将深度补全任务放大称为数据补全(图像修复)

2.Spade_RGBD提出晚期融合模型更早,但他用这种晚期融合模型是为了稀疏深度图下语义分割效果更好

3.缺点:该编码器-解码器在稀疏深度上表现出可接受的性能,但未能从密集RGB中提取良好的特征。

4.对于稀疏卷积:掩模饱和(视为有效的百分比)如预期的那样随输入密度而增加,但仅在几层之后就达到几乎完全饱和,这意味着有效性信息在后面的层中很快丢失。

5.对于早期融合模型:为了同时从两者进行推理,似乎最好在融合之前将其转换为类似的特征空间

早期融合有没有解决这个问题?

tips

训练CPN数据集:

Gaidon A, Wang Q, Cabon Y, et al. Virtual worlds as proxy for multi-object tracking analysis[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 4340-4349.

 

文章贡献:

1.介绍了生成虚拟世界视频数据集的方法

2.创建了虚拟的kitti数据集

3.比较了真实世界和虚拟世界在学习深度模型上的有效性

4.因为是虚拟的世界,可以人为的加入干扰条件(雨雾等)进行实验

 

监督DCN的数据集:

Uhrig J, Schneider N, Schneider L, et al. Sparsity invariant cnns[C]//2017 international conference on 3D Vision (3DV). IEEE, 2017: 11-20.

       来自文章里的方法对稀疏深度补全后的kitti数据集,ground truth深度图获取的一种方法是用数据集进行重建,渲染,然后得到获取补全后的depth图像作为真值.

       我们进一步遵循[16]并累积11次激光扫描,以增加生成深度图的密度

方法详解

 

A:上分支对密集深度进行编码,并与图像编码相连,以在解码器处生成深度的密集重建,以及可作为后验分数的归一化似然。我们将CPN视为一个函数,在给定图像(下分支输入)的情况下,该函数将任何样本假设深度图(上分支输入)映射为正实数,该实数表示给定图像的输入密集深度图的条件概率先验。

      CPN网络作用是学习先验概率,即图像对应其稠密深度值的这种映射关系,然后网络的输出为重建的稠密深度,此时的输出可以当作用于计算后验概率的似然,由于似然相当于给计算概率加上了参数,所以CPN网络的输出也就作为这个参数进行后续的计算。

B:它具有对称的两个分支结构,每个分支对不同类型的输入进行编码:一个是稀疏深度,另一个是图像;为两个分支启用跳过连接。与稀疏深度和图像的早期融合不同,我们的深度将融合推迟到解码,这需要更少的可学习参数。

      DCN网络属于有监督方法,监督信号来自稀疏卷积论文中,通过累计相邻稀疏激光雷达测量值生成的,但实际密度只有图像域的30%

CPN目的为了得到先验概率和归一化似然,本质是无监督

DCN目的得到最终的后验概率,方法是有监督的

KITTI基准中“监督”和“非监督”之间的差异更多的是定量的,而不是定性的

下面是原始的CPN结构:

        原始的CPN结构也是作者自己2018年提出的对光流的先验网络,属于无监督方法,学习P(f | I)的条件先验网络(CPN)体系结构:上半分支对ground truth光流进行编码,然后取图像和上半编码的输出重建f

损失函数

1.CPN网络的损失:

        wCPN为CPN中的参数集合,wCPN(d,I)表示解码深度,重建误差与条件分布成比例

2.1有监督情况下的损失:

        φ为稀疏深度和图像到密集深度的映射

2.2无监督情况下的损失

        CPN等式(2)与假设深度图d下观察到的稀疏点云z的可能性模型相结合

损失函数为:

2.3视差监督

      我们利用KITTI 2015立体声基准的手动清理训练集作为参考数据。我们利用深度和差异之间的强大关系。除了稀疏深度z和图像I之外,我们还得到了第二个图像I′,作为立体对的一部分,该图像被校正(标准预处理)为一阶,我们假设存在位移s=s(x),x∈ D因此

       这是强度恒定约束,再将视差建模s=FB/d,其中F是焦距,B是摄像机的基线(光学中心之间的距离)。因此,我们可以从预测的密集深度d合成视差s,从而约束三维场景几何体的恢复。更具体地说,我们将看到给定I,d的I′的可能性建模为

        强度恒定约束受限制,再加入结构相似性SSIM,这种情况下的先验概率:

最后立体设置的损失:

       我们使用Praw(I′|I,d)和Pssim(I′|I,d)分别表示在原始光度值和SSIM分数中测量的给定I,d的I′概率。其中ψc表示等式(9)中的原始强度总和项,ψs表示SSIM对应项。

优缺点

1.虽然勉强,但也算是在有监督和无监督都做了相应的实验,得到的结果都还可以


总结

这个文章对贝叶斯相关理论解释的挺好:先验概率、似然函数与后验概率 - jianguo_wang - 博客园 (cnblogs.com)


http://chatgpt.dhexx.cn/article/J86HpWVY.shtml

相关文章

扩散模型(Diffusion model)代码详细解读

扩散模型代码详细解读 代码地址:denoising-diffusion-pytorch/denoising_diffusion_pytorch.py at main lucidrains/denoising-diffusion-pytorch (github.com) 前向过程和后向过程的代码都在GaussianDiffusion​这个类中。​ 有问题可以一起讨论! …

DIFFUSION POSTERIOR SAMPLING FOR GENERALNOISY INVERSE PROBLEMS (Paper reading)

DIFFUSION POSTERIOR SAMPLING FOR GENERALNOISY INVERSE PROBLEMS Hyungjin Chung, Kim Jae Chul Graduate School of AI, ICLR 2023 spotlight, Cited:10, Code, Paper. 目录子 DIFFUSION POSTERIOR SAMPLING FOR GENERALNOISY INVERSE PROBLEMS1. 前言2. 整体思想3. 方法实…

Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation

Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation(探索和提炼后验和先验知识的放射学报告生成) 先验与后验目前的放射学报告生成的局限性Paper的贡献模型详解模型输入模型主要部分 先验与后验 在阅读这篇Paper…

国际会议poster: 海报制作流程 格式介绍

1 流程 word制作, 转pdf, 打印 2 模板 UCLhttps://wenku.baidu.com/view/034bcb7e4a7302768f99392a.html 3 CYBER2019格式要求 海报尺寸:A1尺寸23.4英寸(59.4厘米)宽,33.1英寸(84.1厘米)高。 请注意,以A4尺寸列印已递交的整张纸作为海报是不可…

概率基础 · 联合概率 边缘概率 prior posterior likelihood

概率基础 联合概率 边缘概率 prior posterior likelihood 联合概率 (Joint Probability)边缘概率(margin probability)贝叶斯定理(Bayes Theorem)prior,posterior,likelihood:概率与似然的区别…

Stochastic Image Denoising By Sampling from the Posterior Distribution (Paper reading)

Stochastic Image Denoising By Sampling from the Posterior Distribution (Paper reading) Bahjat Kawar, Haifa(Israel), ICCV Workshop2021, Cited:22, Code:无, Paper. 目录子 Stochastic Image Denoising By Sampling from the Posterior Distribution (Paper reading)1…

GAN论文精读 P2GAN: Posterior Promoted GAN 用鉴别器产生的后验分布来提升生成器

《Posterior Promoted GAN with Distribution Discriminator for Unsupervised Image Synthesis》是大连理工学者发表的文章,被2021年CVPR收录。 文章地址:https://ieeexplore.ieee.org/document/9578672 本篇文章是阅读这篇论文的精读笔记。 一、原文…

先验、后验与似然

在学习SLAM 14讲第六章时,看到三个概念,有些不太了解,查阅资料后有了一些自己的理解。 三个概念存在于贝叶斯公式中 表示先验概率Prior,表示后验概率posterior,表示似然likelihood 上式可以写为 下面分别对三个概念进…

Prior 、Posterior 和 Likelihood 的理解与几种表达方式

Prior 、Posterior 和 Likelihood 的理解与几种表达方式 (下载图片可以看大图。)

Windows作为NTP同步时间的服务器时的设置

1.先关闭Windows系统自带的防火墙; 2. 在桌面上右击“计算机”, 选择“管理”, 然后选择“服务”。 具体如图所示 2. 选中“Windows Time”,设置为开启,这样就可以将“Windows Time”这一个服务打开。 3. “开始”--》“运…

NTP时钟服务器推荐-国内时间服务器顶尖设备

电子钟时间服务器在物联网应用中起到了关键的作用,它能够为各种智能设备提供准确的时间参考,确保设备之间的协同工作和数据的准确传输。无论是智能家居、智能工厂还是智慧城市,电子钟时间服务器都是不可或缺的一部分。 一、产品卖点 时间服…

NTP同步时间失败。Linux作为客户端,Windows作为NTP时钟源服务端。

使用windows作NTP时钟源,NTP同步时间失败 【关 键 词】:NTP,时钟源,windows时钟源,同步时间失败 【故障类型】:操作维护->其他 【适用版本】:Linux 【问题描述】:windows做时钟…

如何在windows10 搭建 NTP 时间服务器

windows本身是可以作为NTP时间同步服务器使用的,本文介绍一下如何在win10上配置NTP时间同步服务器。 如何在windows10 搭建 NTP 时间服务器 工具/原料 系统版本:win10版本 [10.0.17134.706] 方法/步骤 使用组合键WIN R 启动运行窗口,在…

Linux服务器NTP客户端时钟同步配置方法

前提说明:配置客户端NTP时候,必须要有一台时钟服务器,可以是服务器搭建的,也可以是购买的时钟设备。我这里使用临时的时钟服务器IP地址10.10.4.100 步骤如下: 1 首先在客户端服务器中ping一下时钟的IP地址是否网络可通…

NTP时钟服务器(PTP服务器)无法同步的排查方法

NTP时钟服务器(PTP服务器)无法同步的排查方法 NTP时钟服务器(PTP服务器)无法同步的排查方法 NTP系统是典型的C-S模型,一般将整个系统分为服务器,网络和客户端三个区域,因NTP时间服务器一般在出厂时已经测试,并设置为可使用&#…

NTP时间服务器同步时钟系统安装汇总分享

在现代科技发展的背景下,各种设备的时间同步变得越来越重要。同步时钟管理系统的应用可以让多个设备在时间上保持一致,提高工作效率和安全性,为各个行业的发展提供了重要的支持。 一、同步时钟系统介绍 同步时钟管理系统的应用范围非常广泛&…

关于NTP时间服务器

NTP(Network Time Protocol) 网络时间协议,工作在UDP的123端口上。是用来使计算机时间同步化的一种协议,它可以使计算机对其服务器或时钟源(如石英钟,GPS等等)做同步化,它可以提供高精准度的时间校正(局域网…

R语言产生对角阵、次对角阵等矩阵及矩阵运算

R语言产生各种类型的矩阵及矩阵运算 R语言产生一般的矩阵R语言产生单位阵R语言产生次对角阵R语言矩阵的常见运算 R语言产生一般的矩阵 # 依行排列,产生3行5列的矩阵 A matrix(c(1:15),3,5,byrowT)R语言产生单位阵 #产生对角线元素为1的6x6的单位阵 A diag(6) #产…

python课程设计矩阵对角线之和_python对角矩阵

广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! #生成一个3*3的0-10之间的随机整数矩阵,如果需要指定下界则可以多加一个参数data5mat(random.…

SimpleMind Pro(电脑版思维导图软件)官方中文版V1.30.0.6068下载 | 电脑版思维导图软件哪个好用?

​ Simplemind Pro 是一款优秀的跨平台电脑版思维导图软件领导者,全球超过1000万用户,可帮助用户组织想法、记住信息并产生新想法,允许用户将主题放置在自由格式布局中的任何位置,或者使用各种自动布局之一,非常…