超分辨率学习

article/2025/9/16 6:53:01

超分辨率学习

  • 传统图像超分辨率重建方法
    • 基于插值
    • 基于重建
    • 基于学习(机器学习)
    • 基于深度学习
  • 获取低分图像的方法
    • 简单下采样
    • 加入模糊和噪声的下采样
  • 超分图像的评价指标
    • 客观
      • 峰值信噪比PSNR(DB)
      • 结构相似度SSIM
    • 主观:意见平均分MOS
  • 超分网络结构分类
    • 预上采样
    • 后上采样
    • 逐步上采样
    • 交替式上下采样
  • SRCNN
  • 未来研究方向

开始学习超分辨率相关内容,笔记记录如下

传统图像超分辨率重建方法

基于插值

基于插值的超分辨率图像重建算法(1)

  1. 最邻近插值法(Nearest neighbor):令变换后像素灰度值等于离它最近的输入像素的灰度值
  2. 双线性插值法(Bilinear interpolation algorithm):通过中心像素点旁边四个相邻点的像素分别在水平和垂直两个方向上做线性内插得到最终待插值点的像素值。
  3. 双三次插值法(bicubic interpolation):双三次插值将带采样点旁的4个邻点扩展为16个,对这16个邻点灰度值做三次插值。

用插值的方法进行图像超分辨(python实现)
图像超分辨——基于插值的方法(个人总结)(matlab实现)

基于重建

图像超分辨率重建简介
基于重建的超分辨率方法的基础是均衡及非均衡采样定理。它假设低分辨率的输入采样信号(图像)能很好地预估出原始的高分辨率信号(图像)。绝大多数超分辨率算法都属于这一类,其中主要包括频域法和空域法。
频率域方法是图像超分辨率重建中一类重要方法,其中最主要的是消混叠重建方法。消混叠重建方法是通过解混叠而改善图像的空间分辨率实现超分辨率复原,最早的研究工作是由Tsai 和 Huang在1984年进行的。在原始场景信号带宽有限的假设下,利用离散傅立叶变换和连续傅立叶变换之间的平移、混叠性质,给出了一个由一系列欠采样观察图像数据复原高分辨率图像的公式。多幅观察图像经混频而得到的离散傅立叶变换系数与未知场景的连续傅立叶变换系数以方程组的形式联系起来,方程组的解就是原始图像的频率域系数,再对频率域系数进行傅立叶逆变换就可以实现原始图像的准确复原。
在空域类方法中,其线性空域观测模型涉及全局和局部运动、光学模糊、帧内运动模糊、空间可变点扩散函数、非理想采样等内容。空域方法具有很强的包含空域先验约束的能力,主要包括非均匀空间样本内插、迭代反投影方法、凸集投影法、最大后验概率以及混合MAP/ POCS 方法、最优和自适应滤波方法、确定性重建方法等。

基于学习(机器学习)

降秩产生训练集训练或者采用字典学习的方法学习稀疏表达
example-based方法、领域嵌入、支持向量回归、稀疏表示

基于深度学习

是一个监督学习,将高分图像下采样成低分图像,再将低分图像放到神经网络中训练出超分图像,最小化超分图像和高分图像的误差

获取低分图像的方法

公式
Ix是低分图像,Iy是高分图像,D是降级函数
获取低分图像的过程中可能遇到的问题:散焦、噪点、压缩失真、传感器噪声

简单下采样

公式
s表示下采样倍数

加入模糊和噪声的下采样

公式
高分图像Iy做以k为卷积核的卷积操作下采样后加上噪声n
模糊和噪声的下采样

超分图像的评价指标

客观

峰值信噪比PSNR(DB)

公式
第一个公式是求高分图像和超分图像对应像素点像素值的均方误差(越小越好)
第二个公式中 L表示像素点取值范围的上限(eg.255)(越大越好)
缺点:仅评价两幅图的平均像素差 无法评价两幅图之间的感知差异

结构相似度SSIM

亮度(像素点均值)、对比度(像素点方差)、结构(像素点协方差),C1、C2、C3为常数
公式
范围[0,1],越接近1图像越相似

主观:意见平均分MOS

人工打分

超分网络结构分类

一文带你入门超分网络及其渐进式上采样方法

预上采样

结构
一开始使用固定的上采样方式将低分图像放大到指定尺寸,然后将图片放入卷积层中,由模糊图像向高清图像映射
优点:无需考虑输入输出图像尺寸不匹配问题,简化建模过程
缺点:固定上采样过程可能产生虚假纹理,所有计算都在高维空间中执行,增加计算成本

后上采样

结构
先进行卷积,再做上采样,可以让网络自适应的学习上采样的过程,还能让特征提取过程在低维空间中完成,降低计算成本。但是当上采样的倍数过大时,过多的信息缺失可能会导致上采样层学习难度太高,而且由于上采样层固定,所以不能适应不同的输入输出尺寸,放大倍数改变都要重新训练。

逐步上采样

结构
通过多次上采样逐步获得目标尺寸的超分图片。降低训练难度,一定程度上适配各种放大倍数。多阶段训练可以结合一些特定的方法进一步减小训练难度。但由于他本来结构就比较复杂,所以训练难度还是很高。

交替式上下采样

结构
新方法。挖掘低分和高分图像之间的依赖关系。但是上下采样层的结构比较复杂。

SRCNN

结构
将低分图像,进行插值放大(双三次),经过9×9的卷积和relu激活,提取特征,再经过1×1的卷积层和激活函数进行非线性的映射,最后输入到5×5的卷积层+relu层中,重建出SR图片。
深度学习图像超分辨率开山之作SRCNN(一)原理分析
深度学习图像超分辨率开山之作SRCNN(二)pytorch实现

未来研究方向

1)发展和寻求新的退化模型,使成像模型更加精确和全面,实现对点扩散函数和噪声的精确估计。图像超分辨率增强的成功依赖于准确的、符合实际成像系统特性和成像条件的降模型,而要获得符合实际成像过程的降质模型是十分困难的,通常采用简单、确定的降质模型进行近似,这样的近似模型与实际成像过程差距较大。
2)压缩域的超分辨率重建。传统的超分辨率算法都是针对图像序列,而实际中最常见的图像序列是视频文件。因而下一步的工作可以针对不同的视频压缩格式和编解码技术,在超分辨率算法中综合考虑成像模型和压缩算法带来的图像降质效果,以及运动补偿和编码传输机制,实现压缩域的超分辨率重建。
3)效率和鲁棒性问题。目前的超分辨率算法具有很高的计算复杂度,如何减少计算量,提高算法速度,是下一步值得研究问题。同时,在目前很多算法中都做了各种假设,如照度变等,这在实际应用中是很难满足的,因此需要研究稳健的算法满足实际应用的需要。
4)模糊图像和三维图像的超分辨率研究。模糊一直是图像处理中的一个难点,如何对模糊图像进行超分辨率需要进一步研究。目前针对三维图像的超分辨率研究还很少,如何对三维图像进行建模也是一个值得研究的课题。
5)超分辨率客观评价标准研究。目前对于图像超分辨率结果主要依靠人的主观评价,缺少一种客观的评价标准,现有的PSNR、MSE等并不能很好的反映超分辨率效果,需要发展一种客观的评价机制。


http://chatgpt.dhexx.cn/article/yenh0NoK.shtml

相关文章

超分辨率综述

概念: 图像超分辨率(image super resolution, SR)是计算机视觉和图像处理中一类重要的图像处理技术,是指从低分辨率(low resolution, LR)图像中恢复高分辨率(high resolution, HR)图像的过程。它有广泛的现实世界的应用,如医学成像&#xff0…

揭秘超分辨率的正确打开方式

写在前边:图像和视频通常包含着大量的视觉信息,且视觉信息本身具有直观高效的描述能力,所以随着信息技术的高速发展,图像和视频的应用逐渐遍布人类社会的各个领域。近些年来,在计算机图像处理,计算机视觉和…

【超分辨率】3分钟带你读懂

内容概述:超分辨率技术是指从观测到的低分辨率图像重建出相应的高分辨率图像,随着深度学习技术的发展,超分辨率技术在电影、医疗影像、游戏等领域的应用,也愈发广泛。在本文中,帝视科技将深入探讨超分辨率的背景及原理…

基于深度学习的图像超分辨率——综述

2021-Deep Learning for Image Super-resolution:A Survey 基本信息 作者: Zhihao Wang, Jian Chen, Steven C.H. Hoi, Fellow, IEEE 期刊: IEEE Trans Pattern Anal Mach Intell(16.389) 引用: 156(热点论文) 摘要: 本文旨在对…

区块链学习笔记

廖雪峰的官方网站-区块链教程 https://www.liaoxuefeng.com/wiki/1207298049439968 思维导图整理

区块链学习三

目前,作为客户端验证区块链的主要方法有两种:全节点和 SPV 客户端。 全节点 第一个也是最安全的模型是比通过下载和验证从创世块一直到最近发现的块的块来确保块链的有效性。 要欺骗客户端,攻击者需要提供一个完整的替代区块链历史&#x…

区块链学习路径,看这一篇就够了 | FISCO BCOS

FISCO BCOS开源社区已沉淀过百篇文章,覆盖了区块链学习各个阶段。为了方便大家对应自身学习阶段找到合适的教程,我们按照区块链学习成长路径对社区文章进行整理排序,希望沿着这份路径规划,大家都能成为独当一面的区块链专家。 我…

区块链学习路线图 初阶+中阶+高阶

一、报告名称 区块链学习路线图 二、作者 张开翔 微众银行区块链首席架构师 三、若需要pdf版本 关注公号”元宇宙最新报告”,回复关键词“区块链学习路线图”,获取百度网盘免费下载链接。 免责声明:文章报告仅代表原作者观点,版…

区块链学习——原理入门

刚开始学习区块链,由于刚入门,所以借鉴了一些大佬的总结,仅作个人学习使用。 刚开始了解区块链,应当对其概念有所了解,要分清链圈和币圈。首先要了解区块链的概念,原理,核心技术。随后要去读一些…

区块链学习笔记3——BTC协议

区块链学习笔记3——BTC协议 学习视频:北京大学肖臻老师《区块链技术与应用》 笔记参考:北京大学肖臻老师《区块链技术与应用》公开课系列笔记——目录导航页 数字货币所面临的主要挑战 Double spending attack(双花攻击,同一张数…

区块链学习1-证书

加密和签名: 在现实生活中,如果想在某个银行存钱或者取钱,首先要开立账户,这是中心化系统的标准流程。在区块链中,我们同样需要具备这样一个账户: 公链是去中心化的,每个用户自己决定是否开户…

区块链学习笔记及总结【二】

区块链总述 区块链是比特币的核心技术,在比特币系统里用来记录有序且带有时间戳的交易记录。主要用于防止(double spend)双花攻击和篡改以前的交易记录。 这里需要注意是防止篡改,不是防止更改。实际上区块链某些情况还鼓励更改…

区块链学习心得

暑假在杭州一家区块链网络公司实习,由于工作原因,学习了区块链的一些基础知识,关于区块链的知识,我是学习的《区块链基础知识25讲》,这本书真的非常不错,有时间的小伙伴可以拿来学习一下。当然我这里也就是…

区块链学习路线

泛读精读,建立框架 区块链的创新在于老技术的组合创新,也正是区块链技术的系统之美,包括:分布式系统、拜占庭问题、密码学、数据结构、P2P网络等技术,以及博弈论、经济学等思想。针对这个特点要系统化学习,…

【区块链】区块链技术学习总结

文章目录 一、区块链技术简介1.1 区块链概念1.2 区块链应用1.2.1 区块链1.0技术:比特币1.2.2 区块链2.0技术:以太坊1.2.3 区块链3.0技术:价值互联网 二、区块链1.0技术比特币2.1 比特币2.1.1 比特币概念2.1.2 比特币性质2.1.3 比特币解决的问…

注意力机制综述

注意力最近几年在深度学习各个领域被广泛使用,无论是图像分割、语音识别还是自然语言处理的各种不同类型的任务中,注意力机制都在其中大放异彩 介绍 注意力(attention)机制最初应用于机器翻译任务,现在已被广泛地应用…

注意力机制原理

Attention机制在近几年来在图像,自然语言处理等领域中都取得了重要的突破,被证明有益于提高模型的性能。Attention机制本身也是符合人脑和人眼的感知机制,这次我们主要以计算机视觉领域为例,讲述Attention机制的原理,应…

GAM注意力机制

1.GAM注意力机制: 图像解析: 从整体上可以看出,GAM和CBAM注意力机制还是比较相似的,同样是使用了通道注意力机制和空间注意力机制。但是不同的是对通道注意力和空间注意力的处理。 2.CBAM注意力解析 CBAM CAM BAM 对于通道注意…

注意力机制详解系列(三):空间注意力机制

👨‍💻作者简介: 大数据专业硕士在读,CSDN人工智能领域博客专家,阿里云专家博主,专注大数据与人工智能知识分享。 🎉专栏推荐: 目前在写CV方向专栏,更新不限于目标检测、OCR、图像分类、图像分割等方向,目前活动仅19.9,虽然付费但会长期更新,感兴趣的小伙伴可以…

注意力机制+注意力汇聚

学习《动手学习深度学习》注意力机制 之后,简单做个总结。 注意力提示 假设坐在一个物品很多的房间里,我们容易受到比较显眼的物品的吸引,进而将注意力倾注在那个物品上,这样我们就忽略了周围物品;换一种情形&#x…