一、SynSin: End-to-End Synthesis from a Single Image (CVPR2020)
该论文给出了一个视角图片生成的方法,其pipeline如下图:

首先将图片输入特征和深度网络得到特征map和深度图,接着通过相机参数变换为带特征的点云,接着根据相对变换矩阵T,将带特征的点云渲染到二维像素位置上,接着通过一个GAN生成最终的新视角图片。
该论文的渲染方式值得关注,其并不是简单的使用zbuffer和固定投影像素位置渲染的,在z深度和平面广度上都是软映射的。

平面广度上是线性递减的辐射,在深度上取k近邻并排序后,按照次序递减:


这种软渲染的方式估计会牺牲较大的渲染精度,但是对于优化问题来说非常合适不过。
二、Free View Synthesis (ECCV 2020)

该工作的框架大致为:利用其他角度的视图,经过特征编码之后,用估计的深度和角度进行warping,转换到目标视角下。随后使用Unet为GRU单元的循环神经网络输出多个预测图像和置信度,随后依照置信度进行加权求和,获得最终的图像。由于是循环神经网络,因此可以有任意多个输入帧进行新视角视图预测。

















