超分辨率基础

article/2025/9/15 13:24:51

超分辨率综述
Image Super-resolution 的深度学习方法
微信二维码引擎OpenCV开源
微信扫码背后的图像超分辨率技术
技术解析 | 即构移动端超分辨率技术
DIV2K数据集下载
B100/Manga109/Set5/Set14/Urban100 提取码:q4ev

超分难点延伸出的技术方向
上采样倍数是整数无极放大
人造的退化图像与现实有差距现实场景超分、盲超分
推理时间长轻量超分
需要低分与高分图像对无监督超分
评价指标与主观不一致

论文

1、ARM: Any-Time Super-Resolution Method ECCV2022、腾讯优图

此前的方法无法在推理时根据推理样本和可用计算资源动态调整计算开销,因次此一个模型无法适应多种设备平台和多变的资源情况。
基于此,我们提出一种任意时间超分方法(ARM),从而使得一个超分网络能够在推理时调整为任意的计算开销。第一,我们训练了一个包含不同大小子网的ARM超网,其中包含多个推理开销不同的子网,以便在推理时进行切换。第二,我们基于边缘检测分数与PSNR的相关性的发现,构建了一个Edge-to-PSNR查找表,用于通过边缘分数来预测不同子网对某个样本的预期PSNR。第三,我们设计了一个由超参η控制的子网选择函数,该函数可以根据不同子网的预期PSNR和对应的计算量进行子网的选择。

最后在推理时,我们设计了一套patch切分、patch推理、patch拼接的推理流程,其中patch推理的部分使用子网选择函数自适应地选择子网进行推理。实验结果显示本文方法效果超过了最先进的动态超分方法,并在FSRCNN、CARN和SRResNet等经典超分骨干网络上的实验结果取得的SOTA的效果。
在这里插入图片描述

人脸超分

在这里插入图片描述
GCFSR: a Generative and Controllable Face Super Resolution Method Without Facial and GAN Priors

实时视频超分

Real-Time Super-Resolution System of 4K-Video Based on Deep Learning
github
paper
高糊视频秒变4K,速度快了9倍!东南大学提出新的视频超分辨率系统
在这里插入图片描述

在这里插入图片描述

不适定问题

图像超分辨率是一个典型的不适定问题,因为低分辨图像与它对应的高分辨图像之间是个一对多的关系。适定问题需要同时满足三个条件:① 解是存在的;② 解是唯一的;③ 解是稳定的。

图像复原、图像重建

在这里插入图片描述
在这里插入图片描述

图像重建(Image Reconstruction)是从分散或不完整的数据(如医学成像研究中获取的辐射读数)生成二维或三维图像,有必要应用一个数学公式来生成一个可读和可用的图像,或者使图像锐化以使其有用,图像重建有助于从一系列单独的相机图像生成人体的三维图像。

超分商业应用

《海上钢琴师》重映背后,AI超分算法的高光与阴影
SuperResolution论文与应用简介:基于深度学习的图像超分辨率方法
HMS Core机器学习服务图像超分能力,基于深度学习提升新闻阅读体验
Real-CUGAN,B站推出的图像视频AI超分算法模型(AI放大)

超分无极放大

1、Meta-SR(旷视科技)
在这里插入图片描述

2、LIIF-SR(英伟达)
在这里插入图片描述
无极超分辨率
真正的无极放大!30x插值效果惊艳,英伟达等开源LIIF
LIIF官网

opencv的超分接口

1、github入口,只能cpu推理,只支持4个模型
在这里插入图片描述
2、超分和双三次性能对比
在这里插入图片描述

纹理的学习

Learning Texture Transformer Network for Image Super-Resolution
在这里插入图片描述

盲超分

盲超分也有HR,只不过它的训练集研究的是未知退化图片的超分,非盲超分的输入LR是对HR通过固定退化函数(如双三次插值,高斯核)下采样得到。
最新!基于深度学习的盲图像超分技术一览

传统超分辨率方法

1、插值方法
2、基于稀疏表示(字典学习)的方法
3、基于局部嵌入(Neighbor Embedding)的方法
4、Example-Based的方法
图像超分辨——传统方法
OpenCV图像插值方法的比较
图像超分辨率技术简介

深度学习超分辨率

  • 论文
    VDSR
    Accurate Image Super-Resolution Using Very Deep Convolutional Networks, CVPR2016
    第一个将全局残差引入SR的方法,使得训练速度明显加快,低分辨率图像携带的低频信息与高分辨率图像的低频信息相近,训练时带上这部分会多花费大量的时间,实际上只需要学习高分辨率图像和低分辨率图像之间的高频部分残差即可。残差网络结构的思想特别适合用来解决超分辨率问题,可以说影响了之后的深度学习超分辨率方法。
    SRGAN(SRResNet)
    Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network, CVPR2017
    生成对抗网络用在了解决超分辨率问题上。文章提到,训练网络时用均方差作为损失函数,虽然能够获得很高的峰值信噪比,但是恢复出来的图像通常会丢失高频细节,使人不能有好的视觉感受。SRGAN利用感知损失(perceptual loss)和对抗损失(adversarial loss)来提升恢复出的图片的真实感。
    EDSR
    Enhanced Deep Residual Networks for Single Image Super-Resolution, CVPR2017
    是NTIRE2017超分辨率挑战赛上获得冠军的方案。EDSR最有意义的模型性能提升是去除掉了SRResNet多余的模块,从而可以扩大模型的尺寸来提升结果质量。主要使用了增强的ResNet,移除了batchnorm,使用了L1 loss训练

  • 图像超分基本不使用Batch Normalization

  • LapSRN可实现同时多个尺寸超分,Meta-SR可实现任意尺寸超分。

  • 现在超分基本都是基于双三次插值退化模型的超分,用于真实环境效果不是很理想。

  • 亚像素卷积和反卷积进行上采样

  • PSNR及SSIM评价指标
    在这里插入图片描述
    其中 I 、K表示两个MxN的单色图像。 MAX表示图像点颜色的最大值,如果像素值为【0,255】则MAX=255。如果像素值为【0,1】则MAX=1。对于彩色图像来说PSNR的定义类似,只是MSE 是所有方差之和除以图像尺寸再除以 3;或者RGB转换到YCbCr空间,只考虑亮度通道来计算PSNR和SSIM。

    PSNR是图像、视频处理领域应用最广的性能量化方法,计算复杂度小,实现速度快,已经应用在视频编码标准H.264、H.265中。尽管PSNR具有上述特点,但是局限性很明显,受像素点的影响比较大,与主观评价一致性比较低,没有考虑人类视觉系统(Human Visual System, HVS)的一些重要的生理、心理、物理学特征。基于HVS,提出了误差灵敏度分析和结构相似度分析(Structural SIMilarity Index, SSIM)的评价方法。
    在这里插入图片描述

    结构相似性SSIM从亮度、对比度和结构这三个方面来评估两幅图像的相似性。结构相似性理论认为,自然图像具有极高的结构性,表现在图像的像素间存在着很强的相关性,尤其是在空间相似的情况下。这些相关性在视觉场景中携带着关于物体结构的重要信息。假设人类视觉系统(HSV)主要从可视区域内获取结构信息。所以通过探测结构信息是否改变来感知图像失真的近似信息。

    作为结构相似性理论的实现,结构相似度指数从图像组成的角度将结构信息定义为独立于亮度、对比度的,反映场景中物体结构的属性,并将失真建模为亮度、对比度和结构三个不同因素的组合。用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的度量

    大多数的基于误差敏感度(error sensitivity)的质量评估方法(如MSE,PSNR)使用线性变换来分解图像信号,这不会涉及到相关性。SSIM意在找到更加直接的方法来比较失真图像和参考图像的结构。

质量评估背景

  • 质量评估可分为图像质量评估(Image Quality Assessment, IQA)和视频质量评估(Video Quality Assessment, VQA)。IQA从方法上可分为主观评估和客观评估。主观评估就是从人的主观感知来评价图像的质量,首先给出原始参考图像和失真图像,让标注者给失真图像评分,一般采用平均主观得分(Mean Opinion Score, MOS)或平均主观得分差异(Differential Mean Opinion Score, DMOS)表示。客观评估使用数学模型给出量化值,可以使用图像处理技术生成一批失真图像,操作简单,已经成为IQA研究的重点。图像质量评估算法的目标是自动评估与人的主观质量判断相一致的客观图像质量。然而,主观评估费时费力,在实际应用中不可行,并且主观实验受观看距离、显示设备、照明条件、观测者的视觉能力、情绪等诸多因素影响。 因此,有必要设计出能够自动精确的预测主观质量的数学模型。

  • IQA按照原始参考图像提供信息的多少一般分成3类:全参考(Full Reference-IQA, FR-IQA)、半参考(Reduced Reference-IQA, RR-IQA)和无参考(No Reference-IQA, NR-IQA), 无参考也叫盲参考(Blind IQA, BIQA)。

  • FR-IQA同时有原始(无失真、参考)图像和失真图像,难度较低,核心是对比两幅图像的信息量或特征相似度,是研究比较成熟的方向。

  • NR-IQA只有失真图像,难度较高,是近些年的研究热点,也是IQA中最有挑战的问题。NR-IQA类算法还可以细分成两类,一类研究特定类型的图像质量,比如估计模糊、块效应、噪声的严重程度,另一类估计非特定类型的图像质量,也就是一个通用的失真评估。一般在实际应用中无法提供参考图像,所以NR-IQA最有实用价值,也有着广泛的应用,使用起来也非常方便,同时,由于图像内容的千变万化并且无参考,也使得NR-IQA成为较难的研究对象。

  • RR-IQA只有原始图像的部分信息或从参考图像中提取的部分特征,此类方法介于FR-IQA和NR-IQA之间,且任何FR-IQA和NR-IQA方法经过适当加工都可以转换成RR-IQA方法。

IQA的评估指标

  • 衡量图像质量评估结果的指标有很多,每种指标都有自己的特点,通常比较模型客观值与观测的主观值之间的差异和相关性。常见的2种评估指标是线性相关系数(Linear Correlation Coefficient, LCC)和Spearman秩相关系数(Spearman’s Rank Order Correlation Coefficient, SROCC)。
  • LCC也叫Pearson相关系数(PLCC),描述了主、客观评估之间的线性相关性,
  • SROCC衡量算法预测的单调性
    在这里插入图片描述

传统算法

  • FR-IQA(全参考图像质量评估)

    PSNR、SSIM等等类似于特征

  • NR-IQA(无参考图像质量评估)

    有针对具体失真类型的:比如模糊、块效应、jpeg压缩、噪声等

    基于通用类型的:转化为分类或者回归问题,使用特定的特征进行训练。特征要么统计提取,要么通过机器学习或深度学习发现。

    (1)有基于SVM的方法,提取图像空间域/变换域特征,再基于SVM等模型:代表算法:BIQI, DIIVINE,BRISQUE
    (2)概率模型:代表算法:BLIINDS,NIQE
    (3)基于码本的方法:代表算法:CORNIA

深度学习算法

  • 主要用于NR-IQA
    CNN的优势之一是可以直接将原始图像作为输入,并将特征学习融入到训练过程中。 CNN具有深层次的结构,可以有效地学习复杂的映射,同时要求最小的领域知识。

http://chatgpt.dhexx.cn/article/Z46rhNDh.shtml

相关文章

超分辨率学习

超分辨率学习 传统图像超分辨率重建方法基于插值基于重建基于学习(机器学习)基于深度学习 获取低分图像的方法简单下采样加入模糊和噪声的下采样 超分图像的评价指标客观峰值信噪比PSNR(DB)结构相似度SSIM 主观:意见平…

超分辨率综述

概念: 图像超分辨率(image super resolution, SR)是计算机视觉和图像处理中一类重要的图像处理技术,是指从低分辨率(low resolution, LR)图像中恢复高分辨率(high resolution, HR)图像的过程。它有广泛的现实世界的应用,如医学成像&#xff0…

揭秘超分辨率的正确打开方式

写在前边:图像和视频通常包含着大量的视觉信息,且视觉信息本身具有直观高效的描述能力,所以随着信息技术的高速发展,图像和视频的应用逐渐遍布人类社会的各个领域。近些年来,在计算机图像处理,计算机视觉和…

【超分辨率】3分钟带你读懂

内容概述:超分辨率技术是指从观测到的低分辨率图像重建出相应的高分辨率图像,随着深度学习技术的发展,超分辨率技术在电影、医疗影像、游戏等领域的应用,也愈发广泛。在本文中,帝视科技将深入探讨超分辨率的背景及原理…

基于深度学习的图像超分辨率——综述

2021-Deep Learning for Image Super-resolution:A Survey 基本信息 作者: Zhihao Wang, Jian Chen, Steven C.H. Hoi, Fellow, IEEE 期刊: IEEE Trans Pattern Anal Mach Intell(16.389) 引用: 156(热点论文) 摘要: 本文旨在对…

区块链学习笔记

廖雪峰的官方网站-区块链教程 https://www.liaoxuefeng.com/wiki/1207298049439968 思维导图整理

区块链学习三

目前,作为客户端验证区块链的主要方法有两种:全节点和 SPV 客户端。 全节点 第一个也是最安全的模型是比通过下载和验证从创世块一直到最近发现的块的块来确保块链的有效性。 要欺骗客户端,攻击者需要提供一个完整的替代区块链历史&#x…

区块链学习路径,看这一篇就够了 | FISCO BCOS

FISCO BCOS开源社区已沉淀过百篇文章,覆盖了区块链学习各个阶段。为了方便大家对应自身学习阶段找到合适的教程,我们按照区块链学习成长路径对社区文章进行整理排序,希望沿着这份路径规划,大家都能成为独当一面的区块链专家。 我…

区块链学习路线图 初阶+中阶+高阶

一、报告名称 区块链学习路线图 二、作者 张开翔 微众银行区块链首席架构师 三、若需要pdf版本 关注公号”元宇宙最新报告”,回复关键词“区块链学习路线图”,获取百度网盘免费下载链接。 免责声明:文章报告仅代表原作者观点,版…

区块链学习——原理入门

刚开始学习区块链,由于刚入门,所以借鉴了一些大佬的总结,仅作个人学习使用。 刚开始了解区块链,应当对其概念有所了解,要分清链圈和币圈。首先要了解区块链的概念,原理,核心技术。随后要去读一些…

区块链学习笔记3——BTC协议

区块链学习笔记3——BTC协议 学习视频:北京大学肖臻老师《区块链技术与应用》 笔记参考:北京大学肖臻老师《区块链技术与应用》公开课系列笔记——目录导航页 数字货币所面临的主要挑战 Double spending attack(双花攻击,同一张数…

区块链学习1-证书

加密和签名: 在现实生活中,如果想在某个银行存钱或者取钱,首先要开立账户,这是中心化系统的标准流程。在区块链中,我们同样需要具备这样一个账户: 公链是去中心化的,每个用户自己决定是否开户…

区块链学习笔记及总结【二】

区块链总述 区块链是比特币的核心技术,在比特币系统里用来记录有序且带有时间戳的交易记录。主要用于防止(double spend)双花攻击和篡改以前的交易记录。 这里需要注意是防止篡改,不是防止更改。实际上区块链某些情况还鼓励更改…

区块链学习心得

暑假在杭州一家区块链网络公司实习,由于工作原因,学习了区块链的一些基础知识,关于区块链的知识,我是学习的《区块链基础知识25讲》,这本书真的非常不错,有时间的小伙伴可以拿来学习一下。当然我这里也就是…

区块链学习路线

泛读精读,建立框架 区块链的创新在于老技术的组合创新,也正是区块链技术的系统之美,包括:分布式系统、拜占庭问题、密码学、数据结构、P2P网络等技术,以及博弈论、经济学等思想。针对这个特点要系统化学习,…

【区块链】区块链技术学习总结

文章目录 一、区块链技术简介1.1 区块链概念1.2 区块链应用1.2.1 区块链1.0技术:比特币1.2.2 区块链2.0技术:以太坊1.2.3 区块链3.0技术:价值互联网 二、区块链1.0技术比特币2.1 比特币2.1.1 比特币概念2.1.2 比特币性质2.1.3 比特币解决的问…

注意力机制综述

注意力最近几年在深度学习各个领域被广泛使用,无论是图像分割、语音识别还是自然语言处理的各种不同类型的任务中,注意力机制都在其中大放异彩 介绍 注意力(attention)机制最初应用于机器翻译任务,现在已被广泛地应用…

注意力机制原理

Attention机制在近几年来在图像,自然语言处理等领域中都取得了重要的突破,被证明有益于提高模型的性能。Attention机制本身也是符合人脑和人眼的感知机制,这次我们主要以计算机视觉领域为例,讲述Attention机制的原理,应…

GAM注意力机制

1.GAM注意力机制: 图像解析: 从整体上可以看出,GAM和CBAM注意力机制还是比较相似的,同样是使用了通道注意力机制和空间注意力机制。但是不同的是对通道注意力和空间注意力的处理。 2.CBAM注意力解析 CBAM CAM BAM 对于通道注意…

注意力机制详解系列(三):空间注意力机制

👨‍💻作者简介: 大数据专业硕士在读,CSDN人工智能领域博客专家,阿里云专家博主,专注大数据与人工智能知识分享。 🎉专栏推荐: 目前在写CV方向专栏,更新不限于目标检测、OCR、图像分类、图像分割等方向,目前活动仅19.9,虽然付费但会长期更新,感兴趣的小伙伴可以…