单图像超分辨率重建总结

article/2025/9/15 13:24:45

单图像超分辨率重建总结

定义

单图像超分辨率重建(Single Image Super-resolution Reconstruction,SISR)旨在从给定的低分辨率(LR)图像中,重建含有清晰细节特征的高分辨率(HR)图像,是计算机视觉中较为底层的任务。

方法分类

  • 基于插值的超分辨率重建方法(如最近邻插值、双线性插值和双三次插值等)
  • 基于重构的超分辨率重建方法(如凸集投影法和最大后验概率法等)
  • 基于学习的超分辨率重建方法(稀疏表示法、基于卷积神经网络和基于生成对抗网络等)
image-20220917131021358

基于插值的超分辨率重建方法

线性插值算法

最近邻插值法

最近邻插值法指插值点直接以与其欧式距离最短的像素点的灰度值为自身插值后的灰度值。

  • 优点:难度系数低且易实现。

  • 缺点:放大的倍数高时,容易出现锯齿效应和图像灰度不连续问题。

双线性插值法

双线性插值法主要从垂直、水平两个方向对相邻的四个像素点进行线性插值实现图像插值问题。

  • 优点:在图像灰度不连续问题上有所改进。
  • 缺点:插值后的图像产生明显的细节退化,图像高频信息受到损坏。
双三次插值法

双三次插值法是在双线性插值法的基础上提出的,将邻近区域内四个相邻像素点扩充到十六个相邻像素点,对其使用三次插值多项式后进行加权平均计算完成图像插值重建。

  • 优点:充分考虑了各像素点对目标插值点的影响,提高了重建质量。
  • 缺点:计算复杂 ,运算量急剧增加。

非线性插值算法

边缘导向插值法

边缘导向插值法主要是对RGB三色图像的边缘信息进行约束、放大,以便解决人眼视觉特性对图像边缘信息的捕捉造成的影响。

梯度引导插值法

梯度引导插值法是利用邻域内一阶梯度、二阶梯度的信息调整梯度分布像素分布,再结合边缘导向插值法双线性插值法实现图像重建。

小波变换插值法

小波变换插值法充分利用小波变换所具有的局部细化特点,将图像特征信息分解到不同尺度上独立研究与分析后,将提取的特征信息叠加融合后再用小波逆变换提高图像分辨率。

image-20220918111822747

基于重构的图像重建方法

频域法

Patti 等人最早提出在傅里叶变换频域内消除LR图像的频谱混叠,对多幅LR图像进行傅里叶变换实现超分辨率图像重建。

  • 优点:提高了运算速度和图像精度。
  • 缺点:只适合于整体平移和空间不变的模型,很难解决图像噪音问题。

空域法

非均匀内插法

非均匀内插法对抽象出的非均匀分布的LR图像特征信息进行拟合或者插值得到分布均匀的HR图像特征信息来实现超分辨率图像重建。

  • 优点:重建效率高。
  • 缺点:需要先验信息,缺乏灵活性。
迭代反向投影法

Irani 等人提出迭代反向投影法解决超分辨率图像重建算法对图像先验信息的高依赖性问题,有效改善重建图像质量问题和对图像先验信息依赖问题,但也使得重建图像的唯一性不能得到保证。

凸集投影法

凸集投影法利用HR图像的正定性、有界性、光滑性等限制条件对重建图像的边缘信息结构信息进行保留,但该算法运算复杂度高,收敛速度慢,且每次迭代对先验信息都存在较强的依赖性。

最大后验概率法

最大后验概率法(MAP)是指在已知LR图像序列信息和HR图像后验概率达到最大的前提下,对HR图像进行图像特征信息估计,保证图像解唯一性的同时提高图像清晰度,但图像边缘信息提取有待加强。

MAP/POCS 法

陈光盛等人将POCS 和MAP 结合,在MAP 迭代优化过程中加入POCS 约束凸集中的先验条件,充分发挥出两者的优势,利用POCS 弥补MAP 收敛稳定性和降噪能力弱的缺点,MAP 弥补POCS 边缘和细节保持差的缺点

image-20220918135610692

基于学习的图像重建方法

深度学习前的图像重建算法

基于样例学习法

基于样例学习法起源于Freeman等人根据马尔可夫网络提出的单幅图像重建算法,主要是通过对原始HR图像实施退化操作,建立训练图像特征信息库来学习HR图像的先验信息,以此来恢复图像的高频细节特征信息

邻域嵌入法

邻域嵌入法以图像块为单位对图像特征信息进行提取,构建特征信息库对LR图像块和HR图像块进行加权求和以实现HR图像重建。

  • 优点:减弱了模型对样本的依赖性。
  • 缺点:削弱了模型的灵活性。
稀疏表示法

稀疏表示法重点以字典学习稀疏编码为核心来实现图像图像重建效率与重建质量的有效提升。用稀疏编码对图像块进行表示,再从样本图像中抓取HR图像块和LR图像块,形成超完备字典,并根据字典得到样本图像的系数线性表示,最后根据稀疏系数重建HR图像。


深度学习后的图像重建算法

基于卷积神经网络
  • SRCNN

    SRCNN 先对图片进行下采样预处理,得到LR图像,利用双三次插值放大到目标分辨率,再用卷积核大小分别为9×9、1×1、5×5 的三个卷积层,分别完成特征提取、拟合LR-HR 图像对之间的非线性映射以及将网络模型的输出结果进行重建,得到最后的HR图像。

  • FSRCNN

    与SRCNN 相比,FSRCNN 主要有三点改进:

    • 直接用LR 图像作为输入, 降低特征维度;
    • 使用比SRCNN 更小的滤波器,网络结构加深;
    • 采用后端上采样超分框架,在网络最后加入反卷积层来将图像放大至目标分辨率。
基于生成对抗网络

在Goodfellow等人提出生成对抗网络(GAN)之后,出现了许多基于GAN 的超分辨率图像重建算法,其在图像重建效果、网络运算量、运算速度等方面都有很好的结果。

  • SRGAN

    SRGAN算法首次将生成器网络与判别器网络对抗训练应用到超分辨率图像重建当中,它利用生成器产生HR 图像,判别器判别重建HR 图像和原始HR图像,并反向优化生成器网络与判别器网络,同时用 “感知损失” 代替传统的MSE 损失函数来增强图像细节信息恢复,确保重建图像的高逼真性和高质量性。

    image-20220918142311130
  • ESRGAN

    Wang 等人提出增强型的ESRGAN(enhanced super-resolution generative adversarial network)算法来提高网络泛化能力,用残差缩放加快深层网络的训练速度和缩减网络运算参数量,使得重建HR 图像具有更加丰富的纹理特征,且色彩亮度也更贴近原始HR 图像。

基于深度强化学习

在图像超分领域早期,利用深度学习算法学习LR 图像到HR 图像所有块之间的映射时,没有考虑到块与块之间的相关性。2017 年Qingxing Cao 等人受人类感知过程的启发,从整体图像开始,对不同区域的相关关系进行建模,并按照各个区域的关联线索进行融合,探索具有注意力转移机制的区域序列,结合深度学习强大的学习能力,提出了基于深度强化学习的注意感知人脸超分。

基于Transformer

2020 年Fuzhi Yang 等人最早将Transformer 引入图像超分领域,提出了基于Transformer 网络结构的TTSR 超分算法。为了充分利用参考图像的纹理信息,FuzhiYang 等人在TTSR 中提出了特征融合机制,利用上采样方式实现不同层级间的特征互相融合。大量的实验表明,TTSR 在客观和主观评价方面都取得了显著的进步。

image-20220918144543266

常用数据集

用于深度学习的超分辨率图像重建的图像数据集所涉及的领域较多,涵盖人物、动植物、建筑、自然景观等,且许多开源的数据集在图像外部条件(分辨率大小、张数、格式等)和内部条件(内容、风格、纹理等)上存在着较大差异,具体情况如下表所示。

benchmark 数据集是同一领域内的对比标准,本节主要列举了该领域的benchmark测试数据集,即Set5、Set14、BSD100、Urban100 以及DIV2K 数据集。除此之外,Flickr2K 也是超分领域主流的训练数据集,以及后续提出的具有LR-HR 图像对的真实数据集City100、RealSR、DRealSR。

image-20220918145044266

图像质量评估

图像质量评价(image quality assessment,IQA)的方式主要分为人眼视觉系统感知方面的主观评价实验数值计算方面的客观评价

主观评价

主观评价是指观察者通过眼睛观察重建的HR 图像,主要依据观察者在色彩、清晰度、噪音、质感等方面对图像的综合评价。

  • 意见平均分MOS

    MOS 的中文名称是平均意见评分,是一种常用的主观图像质量评估的方法,通过邀请接受过训练的普通人以及未接受过训练的普通人来对重建的图像进行评分,并且两者人数大致均衡。通过给重建图像打分,再对最后的得分进行平均,在视觉感知方面远远优于其它评价指标,可以准确测量图像感知质量。

客观评价

客观评估是对超分重建结果的定量评价,直接定量地反映图像质量,从数据上可以直接得出结果的好坏。

  • PSNR

    PSNR 的中文名称是峰值信噪比,是图像进行有损变换时最常用的度量指标之一,也是目前超分领域使用最广泛的客观评价指标。PSNR由图像的最大像素值均方误差MSE来定义的,如以下公式所示:

P S N R = 10 l g ( M A X I 2 M S E ) PSNR = 10 lg(\frac{MAX_I^2}{MSE}) PSNR=10lg(MSEMAXI2)

​ 其中, M S E MSE MSE为均方误差, M A X I MAX_I MAXI指表示图像点颜色的最大数值,图像的最大像素值由二进制位数决定,如8位二进制表示的图像的 最大像素值就是255。

  • SSIM

    SSIM 的中文名称是结构相似性,也是目前图像超分领域被广泛使用的性能指标之一。SSIM从人类视觉系统中获得灵感,将图像的组成分为亮度、对比度以及结构三个部分,并用均值作为亮度的估计,标准差作为对比度估计,协方差作为结构相似程度估计,数学表达式如下:

S S I M ( x , y ) = [ l ( x , y ) ] α [ c ( x , y ) ] β [ s ( x , y ) ] γ SSIM(x,y)=[l(x,y)]^ \alpha [c(x,y)]^ \beta [s(x,y)]^ \gamma SSIM(x,y)=[l(x,y)]α[c(x,y)]β[s(x,y)]γ

​ 其中:
l ( x , y ) = 2 μ x μ y + c 1 μ x 2 + μ y 2 + c 1 l(x,y)= \frac{2 \mu_x \mu_y+c_1}{\mu_x^2+\mu_y^2+c_1} l(x,y)=μx2+μy2+c12μxμy+c1

c ( x , y ) = 2 σ x y + c 2 σ x 2 + σ y 2 + c 2 c(x,y)= \frac{2 \sigma_{xy}+c_2}{\sigma_x^2+\sigma_y^2+c_2} c(x,y)=σx2+σy2+c22σxy+c2

s ( x , y ) = σ x y μ y + c 3 σ x σ y + c 3 s(x,y)= \frac{\sigma_{xy} \mu_y+c_3}{\sigma_x \sigma_y+c_3} s(x,y)=σxσy+c3σxyμy+c3

l ( x , y ) l(x,y) l(x,y)表示图像的亮度比较 c ( x , y ) c(x,y) c(x,y)表示图像的对比度比较 s ( x , y ) s(x,y) s(x,y)表示图像的结构比较 μ \mu μ代表均值, σ \sigma σ表示标准差, σ x y \sigma_{xy} σxy表示协方差, c c c为常数,避免出现分母为0导致系统错误。


补充知识

上采样方法

在神经网络占据主导地位的情况下,部分传统的上采样方式因其可解释性以及容易实现,在深度学习的超分模型中经常见到,并且取得让人满意的效果。这里主要介绍基于插值的传统上采样方法端到端可学习的上采样方法

  • 基于插值法的上采样方法

    插值法的原理就是利用一定的数学策略,从相关点中计算出待扩展点的像素值,这在数学上很容易实现,所以在超分重建领域最早采用插值法进行。但是因为插值函数本身的连续性,导致了重建图像较为平滑而模糊。图像纹理处常常是各种突变,这与函数的连续性互为矛盾,这正是基于插值的方法的局限性以及本质问题所在。

  • 端到端可学习的上采样方法

    为了解决基于插值法的上采样方法存在的问题,研究者们提出了端到端可学习的上采样方法:转置卷积亚像素卷积

    • 转置卷积又称为逆卷积,即卷积过程的逆过程。转置卷积通过卷积学习来增大图像分辨率,实现了端到端的放大,避免了人工设计带来的干扰,并且可以与卷积神经网络保持很好的兼容,所以被广泛应用在图像超分辨率重建领域中。
    • 亚像素卷积具体过程就是利用卷积计算对图像进行特征提取,再对不同通道间的特征图进行重组,从而得到更高分辨率的特征图。由于每个像素的扩展都是通过卷积完成,相应的参数都是需要学习产生,解决了插值方法中的存在人工痕迹问题,更好地拟合了像素之间的关系

参考文献

[1]杨才东,李承阳,李忠博,谢永强,孙方伟,齐锦.深度学习的图像超分辨率重建技术综述[J].计算机科学与探索,2022,16(09):1990-2010.

[2]钟梦圆,姜麟.超分辨率图像重建算法综述[J].计算机科学与探索,2022,16(05):972-990.


最后感谢小伙伴们的学习噢~


http://chatgpt.dhexx.cn/article/GL9QJ9L0.shtml

相关文章

基于深度学习的图像超分辨率重建技术的研究

1 超分辨率重建技术的研究背景与意义 图像分辨率是一组用于评估图像中蕴含细节信息丰富程度的性能参数,包括时间分辨率、空间分辨率及色阶分辨率等,体现了成像系统实际所能反映物体细节信息的能力。相较于低分辨率图像,高分辨率图像通常包含…

图像超分辨率评价指标

参考文章:https://zhuanlan.zhihu.com/p/50757421 https://blog.csdn.net/weixin_36815313/article/details/108531674 实现方式有两种 skimage.measure.compare_ssim sk_psnr skimage.measure.compare_psnr(im1, im2, 255) print(sk_psnr ) 手动实现 def calc…

超分辨率——综述文章

参考地址:https://www.jiqizhixin.com/articles/2019-03-15-7 超分辨率研究的意义 超分辨率研究的问题是 将低分辨率的图像重建为高分辨率的图像。这种操作主要有这么几种应用场景: 图像压缩方面,在传输过程中可以只传输低分辨率的图片&am…

超分辨率基础

超分辨率综述 Image Super-resolution 的深度学习方法 微信二维码引擎OpenCV开源 微信扫码背后的图像超分辨率技术 技术解析 | 即构移动端超分辨率技术 DIV2K数据集下载 B100/Manga109/Set5/Set14/Urban100 提取码:q4ev 超分难点延伸出的技术方向上采样倍数是整数无…

超分辨率学习

超分辨率学习 传统图像超分辨率重建方法基于插值基于重建基于学习(机器学习)基于深度学习 获取低分图像的方法简单下采样加入模糊和噪声的下采样 超分图像的评价指标客观峰值信噪比PSNR(DB)结构相似度SSIM 主观:意见平…

超分辨率综述

概念: 图像超分辨率(image super resolution, SR)是计算机视觉和图像处理中一类重要的图像处理技术,是指从低分辨率(low resolution, LR)图像中恢复高分辨率(high resolution, HR)图像的过程。它有广泛的现实世界的应用,如医学成像&#xff0…

揭秘超分辨率的正确打开方式

写在前边:图像和视频通常包含着大量的视觉信息,且视觉信息本身具有直观高效的描述能力,所以随着信息技术的高速发展,图像和视频的应用逐渐遍布人类社会的各个领域。近些年来,在计算机图像处理,计算机视觉和…

【超分辨率】3分钟带你读懂

内容概述:超分辨率技术是指从观测到的低分辨率图像重建出相应的高分辨率图像,随着深度学习技术的发展,超分辨率技术在电影、医疗影像、游戏等领域的应用,也愈发广泛。在本文中,帝视科技将深入探讨超分辨率的背景及原理…

基于深度学习的图像超分辨率——综述

2021-Deep Learning for Image Super-resolution:A Survey 基本信息 作者: Zhihao Wang, Jian Chen, Steven C.H. Hoi, Fellow, IEEE 期刊: IEEE Trans Pattern Anal Mach Intell(16.389) 引用: 156(热点论文) 摘要: 本文旨在对…

区块链学习笔记

廖雪峰的官方网站-区块链教程 https://www.liaoxuefeng.com/wiki/1207298049439968 思维导图整理

区块链学习三

目前,作为客户端验证区块链的主要方法有两种:全节点和 SPV 客户端。 全节点 第一个也是最安全的模型是比通过下载和验证从创世块一直到最近发现的块的块来确保块链的有效性。 要欺骗客户端,攻击者需要提供一个完整的替代区块链历史&#x…

区块链学习路径,看这一篇就够了 | FISCO BCOS

FISCO BCOS开源社区已沉淀过百篇文章,覆盖了区块链学习各个阶段。为了方便大家对应自身学习阶段找到合适的教程,我们按照区块链学习成长路径对社区文章进行整理排序,希望沿着这份路径规划,大家都能成为独当一面的区块链专家。 我…

区块链学习路线图 初阶+中阶+高阶

一、报告名称 区块链学习路线图 二、作者 张开翔 微众银行区块链首席架构师 三、若需要pdf版本 关注公号”元宇宙最新报告”,回复关键词“区块链学习路线图”,获取百度网盘免费下载链接。 免责声明:文章报告仅代表原作者观点,版…

区块链学习——原理入门

刚开始学习区块链,由于刚入门,所以借鉴了一些大佬的总结,仅作个人学习使用。 刚开始了解区块链,应当对其概念有所了解,要分清链圈和币圈。首先要了解区块链的概念,原理,核心技术。随后要去读一些…

区块链学习笔记3——BTC协议

区块链学习笔记3——BTC协议 学习视频:北京大学肖臻老师《区块链技术与应用》 笔记参考:北京大学肖臻老师《区块链技术与应用》公开课系列笔记——目录导航页 数字货币所面临的主要挑战 Double spending attack(双花攻击,同一张数…

区块链学习1-证书

加密和签名: 在现实生活中,如果想在某个银行存钱或者取钱,首先要开立账户,这是中心化系统的标准流程。在区块链中,我们同样需要具备这样一个账户: 公链是去中心化的,每个用户自己决定是否开户…

区块链学习笔记及总结【二】

区块链总述 区块链是比特币的核心技术,在比特币系统里用来记录有序且带有时间戳的交易记录。主要用于防止(double spend)双花攻击和篡改以前的交易记录。 这里需要注意是防止篡改,不是防止更改。实际上区块链某些情况还鼓励更改…

区块链学习心得

暑假在杭州一家区块链网络公司实习,由于工作原因,学习了区块链的一些基础知识,关于区块链的知识,我是学习的《区块链基础知识25讲》,这本书真的非常不错,有时间的小伙伴可以拿来学习一下。当然我这里也就是…

区块链学习路线

泛读精读,建立框架 区块链的创新在于老技术的组合创新,也正是区块链技术的系统之美,包括:分布式系统、拜占庭问题、密码学、数据结构、P2P网络等技术,以及博弈论、经济学等思想。针对这个特点要系统化学习,…

【区块链】区块链技术学习总结

文章目录 一、区块链技术简介1.1 区块链概念1.2 区块链应用1.2.1 区块链1.0技术:比特币1.2.2 区块链2.0技术:以太坊1.2.3 区块链3.0技术:价值互联网 二、区块链1.0技术比特币2.1 比特币2.1.1 比特币概念2.1.2 比特币性质2.1.3 比特币解决的问…