揭秘超分辨率的正确打开方式

article/2025/9/15 13:24:54

img

写在前边:图像和视频通常包含着大量的视觉信息,且视觉信息本身具有直观高效的描述能力,所以随着信息技术的高速发展,图像和视频的应用逐渐遍布人类社会的各个领域。近些年来,在计算机图像处理,计算机视觉和机器学习等领域中,来自工业界和学术界的许多学者和专家都持续关注着视频图像的超分辨率技术这个基础热点问题。本文试着讲述超分辨率技术的正确打开方式,浅谈视频图像的超分辨率技术的基本概念和应用场景等问题。

1.什么是超分辨率?

1.1 超分辨率初体验

简单来讲,图像超分辨率就是提高图像的空间分辨率,例如将一幅图片的分辨率由352x288扩大到704x576,方便用户在大尺寸的显示设备上观看。图像的超分辨率,是图像处理相关问题中的基础问题之一,并具有广泛的实际需求和应用场景,在数字成像技术,视频编码通信技术,深空卫星遥感技术,目标识别分析技术和医学影像分析技术等方面,视频图像超分辨率技术都能够应对显示设备分辨率大于图像源分辨率的问题。

简单来说超分辨率技术可以分为以下两种:**1)**只参考当前低分辨率图像,不依赖其他相关图像的超分辨率技术,称之为单幅图像的超分辨率(single image super resolution),也可以称之为图像插值(image interpolation)。

img

**2)**参考多幅图像或多个视频帧的超分辨率技术,称之为多帧视频/多图的超分辨率(multi-frame super resolution)。

img

这两类技术中,一般来讲后者相比于前者具有更多的可参考信息,并具有更好的高分辨率视频图像的重建质量,但是其更高的计算复杂度也限制了其应用。故,本文后边将以单图超分辨率/图像插值为例,进行超分辨率技术的介绍。

1.2 超分辨率理论描述

这个很直观的超分辨率问题,它的理论描述又是什么样子的呢?如图所示,超分辨率就是将左图中像素点之间的空间位置用像素点进行填充,使得整个图像具有更多的像素点,更丰富的细节,从信号的角度讲就是补充出更多的高频成分。

img

通常在处理这个超分辨率问题的时候,我们常常探索这个退化信号是如何从我们希望的理想信号变化得到的(即分辨率的退化过程),如果对退化过程进行精确地描述,往往对其逆问题的求解有重要的意义。在本文的问题中,即超分辨率的退化模型,可以通过以下公式来描述:

Y = HDX + n

其中Y为低分辨率的视频帧/图像,X为我们理想高分辨率的视频帧/图像,而H和D分别为模糊算子和分辨率下采样算子,n为退化过程中产生的噪声。

img

由上述公式可知该退化问题存在着病构特性,即多个不同的高分辨率图像X,经过相同的退化过程处理,可以得到同样的低分辨率图像Y。这就导致我们无法直接通过Y求解出一个精确的X,也是视频图像超分辨率问题一直是一个开放性问题的原因(逐渐逼近符合人眼视觉认识的解)。

根据图像超分辨率的技术路线进行分类,图像超分辨率技术大致可以分为以下几类:基于定参数的线性滤波器技术,基于图像边缘结构的技术,基于图像重构约束的技术和基于机器学习的技术。

2.什么时候用超分辨率?

先举一个小例子,一张悠久而经典的低分辨率老照片,怎么在一个先进的高清的显示器上播放?这就是低分辨率图片和高分辨率显示设备之间的不匹配。很明显,这个场景下我们可以使用超分辨率技术,如下图所示。

img

单从图像的后处理显示的角度来讲,目前在PC和手机的屏幕显示功能上都配有相应的实时的超分辨率技术。通过观察可知,PC机上的超分辨率技术相对比较简单(比如,临近像素复制or双线性插值),而手机端屏幕的超分辨率技术比PC机显示的超分辨率技术的性能要更好一些,能够提供较好的主观视觉质量,且IOS系统的手机的超分辨率技术相比于一些Andriod系统手机的超分辨率技术性能更高一些。不同的超分辨率算法带来的增强视觉感受的效果不同,一些软件的超分辨率方法在带来更好的视觉质量的同时,也引入了很大的计算代价,不断挑战着显示设备的计算能力。


*3.超分辨率能节省带宽吗?*

那么,前边赘述了这么多超分辨率的基础概念和使用方法,这个技术看起来就是万能的吗?有些人会有疑问,那就可以借着超分辨率技术用小分辨率的图进行通信就好了?其实并不是这样的!

在传输图片的时候,超分辨率和带宽有什么关系呢?一般来讲,现在的通信类应用中,图片都是需要经过压缩,传输,再解压缩这样的一系列过程。最直接的方案*A是按照原分辨率和现有带宽来进行压缩和传输,最终直接显示。而另一种方案B*是,先通过下采样的方法将原视频图像的分辨率下采为原分辨率的1/K,然后在低分辨率和现有带宽下进行压缩和传输,接收端在解码后通过超分辨率技术将该视频图像的分辨率以K倍重建后显示。如图所示

img

这里,超分辨率技术就不单单是一个视频图像的后处理技术,而是基于上下采样的编码传输框架中的一个重要环节。那么问题来了,这种下采样**-超分辨率的图片传输方案B能够节省带宽吗?(最终图片的视觉质量一致的前提下),或者说是在相同的带宽限制下,直接压缩传输大图片和压缩小图片再超分辨率显示,哪一种方案对显示的主观质量更好?**由于在这个场景下两个方案之间不能直观的从理论上比较,所以我们通过实验来进行说明,设计了以下实验:

**原图压缩方案**A,即原始高分辨率图像直接通过编码器进行压缩和传输,在解码端直接得到原始分辨率的重构图像。基于上下采样的图像压缩方案B,即图像首先经过一个分辨率下采样(宽高均为1/2倍)的预处理方法,再将得到的低分辨率图像利用相同的第三方的编解码器WebP进行压缩和传输,最后将在解码端得到的低分辨率图像利用超分辨率技术重建出其高分辨率的图片(这里超分辨率技术选用Google在G+上的方案和一种经典的深度网络的SCN方法)。

下面我们给出两个不同策略下的图像压缩的(图片质量和文件大小)性能的比较,如下图所示。

img

如图(a)和(b)两幅图像的性能比较所示,图像纵坐标为图像全参考的视觉质量评价方法SSIM指标(用来比较相同分辨率下的原图和在对端最终显示的图像的差异),横坐标为图像经由第三方编码器WebP的压缩码流所占用的存储空间(KB),上下采样压缩曲线的四个数据点对应WebP质量因子分别为40,60,80,100,而原图压缩的四个数据点对应WebP质量因子分别是2,5,15,60。

实验中首先验证得到两个认识,一个是随着码率(带宽)的增加,直接压缩传输的方案A能快速的达到近无损压缩或无损压缩。另一个是随着码率(带宽)的增加,超分辨率的方案B具有性能上限的限制,接近上限时,增加码率就只会带来非常微弱视觉性能的提升。

再通过实验曲线可以得出,在低码率范围内,采用原图压缩方案的压缩效率要低于基于采样的图像编码策略(即同等质量下,基于采样的图像编码策略图片文件更小,节省带宽),而在中高码率范围内,采用原图压缩方案的压缩效率要优于基于采样的图像压缩方案(即同等质量下,超分辨率的图像编码策略的图片文件更大,浪费带宽)。

进而我们结合应用环境得出以下结论,在带宽严重受限的情况下,使用超分辨率技术能够改善其原本较差的视觉质量(即超分辨率技术在同等质量下节省传输带宽);在带宽良好的情况下,原图分辨率直接压缩传输的方案能够提供更加好的视觉质量(即超分辨率技术在同等质量下浪费传输带宽和后处理计算资源)。

目前,在常见的一些视频图像的应用中,我们给定的码率均为中高码率以满足图像视频的视觉质量,大部分移动终端上的视频图像应用的方案均为在目标分辨率上直接压缩,质量控制在高于WebP质量因子为60的水平,如实验中验证的一样,在这个码率范围下,采用现有的直接压缩原图方案A要优于下采样压缩低分辨率图像再做解压缩超分辨率的方案B。

3.小结

视频图像超分辨率技术,是图像处理相关问题中的基础问题之一,也是近些年来学术界研究的热点问题。视频图像超分辨率技术作为图像的后处理技术能为了匹配更大分辨率的显示设备够提升图像的主观视觉效果。在压缩传输的应用场景中,为了在同等带宽下获得更高的图像质量,超分辨率算法适用于低带宽时低质量图像上的增强,在带宽充足时仍然应该传输高分辨率图像,即下采样—超分辨率的技术,受限于其性能上限,仅仅在低码率传输条件下,采用超分辨率增强的图像质量明显优于的在大图像上直接编码(即同等质量节省带宽)。综上所述,视频图像超分辨率技术在应用中要考虑计算复杂性限制,传输带宽的限制和视觉性能上限(主观视觉效果)等因素,来选择恰当的应用场景。

本文转自微信后台团队,如有侵犯,请联系我们立即删除

OpenIMgithub开源地址:

https://github.com/OpenIMSDK/Open-IM-Server

OpenIM官网 : https://www.rentsoft.cn

OpenIM官方论坛: https://forum.rentsoft.cn/

更多技术文章:

开源OpenIM:高性能、可伸缩、易扩展的即时通讯架构 https://forum.rentsoft.cn/thread/3

【OpenIM原创】简单轻松入门 一文讲解WebRTC实现1对1音视频通信原理 https://forum.rentsoft.cn/thread/4

【OpenIM原创】开源OpenIM:轻量、高效、实时、可靠、低成本的消息模型 https://forum.rentsoft.cn/thread/1


http://chatgpt.dhexx.cn/article/tPSFICvo.shtml

相关文章

【超分辨率】3分钟带你读懂

内容概述:超分辨率技术是指从观测到的低分辨率图像重建出相应的高分辨率图像,随着深度学习技术的发展,超分辨率技术在电影、医疗影像、游戏等领域的应用,也愈发广泛。在本文中,帝视科技将深入探讨超分辨率的背景及原理…

基于深度学习的图像超分辨率——综述

2021-Deep Learning for Image Super-resolution:A Survey 基本信息 作者: Zhihao Wang, Jian Chen, Steven C.H. Hoi, Fellow, IEEE 期刊: IEEE Trans Pattern Anal Mach Intell(16.389) 引用: 156(热点论文) 摘要: 本文旨在对…

区块链学习笔记

廖雪峰的官方网站-区块链教程 https://www.liaoxuefeng.com/wiki/1207298049439968 思维导图整理

区块链学习三

目前,作为客户端验证区块链的主要方法有两种:全节点和 SPV 客户端。 全节点 第一个也是最安全的模型是比通过下载和验证从创世块一直到最近发现的块的块来确保块链的有效性。 要欺骗客户端,攻击者需要提供一个完整的替代区块链历史&#x…

区块链学习路径,看这一篇就够了 | FISCO BCOS

FISCO BCOS开源社区已沉淀过百篇文章,覆盖了区块链学习各个阶段。为了方便大家对应自身学习阶段找到合适的教程,我们按照区块链学习成长路径对社区文章进行整理排序,希望沿着这份路径规划,大家都能成为独当一面的区块链专家。 我…

区块链学习路线图 初阶+中阶+高阶

一、报告名称 区块链学习路线图 二、作者 张开翔 微众银行区块链首席架构师 三、若需要pdf版本 关注公号”元宇宙最新报告”,回复关键词“区块链学习路线图”,获取百度网盘免费下载链接。 免责声明:文章报告仅代表原作者观点,版…

区块链学习——原理入门

刚开始学习区块链,由于刚入门,所以借鉴了一些大佬的总结,仅作个人学习使用。 刚开始了解区块链,应当对其概念有所了解,要分清链圈和币圈。首先要了解区块链的概念,原理,核心技术。随后要去读一些…

区块链学习笔记3——BTC协议

区块链学习笔记3——BTC协议 学习视频:北京大学肖臻老师《区块链技术与应用》 笔记参考:北京大学肖臻老师《区块链技术与应用》公开课系列笔记——目录导航页 数字货币所面临的主要挑战 Double spending attack(双花攻击,同一张数…

区块链学习1-证书

加密和签名: 在现实生活中,如果想在某个银行存钱或者取钱,首先要开立账户,这是中心化系统的标准流程。在区块链中,我们同样需要具备这样一个账户: 公链是去中心化的,每个用户自己决定是否开户…

区块链学习笔记及总结【二】

区块链总述 区块链是比特币的核心技术,在比特币系统里用来记录有序且带有时间戳的交易记录。主要用于防止(double spend)双花攻击和篡改以前的交易记录。 这里需要注意是防止篡改,不是防止更改。实际上区块链某些情况还鼓励更改…

区块链学习心得

暑假在杭州一家区块链网络公司实习,由于工作原因,学习了区块链的一些基础知识,关于区块链的知识,我是学习的《区块链基础知识25讲》,这本书真的非常不错,有时间的小伙伴可以拿来学习一下。当然我这里也就是…

区块链学习路线

泛读精读,建立框架 区块链的创新在于老技术的组合创新,也正是区块链技术的系统之美,包括:分布式系统、拜占庭问题、密码学、数据结构、P2P网络等技术,以及博弈论、经济学等思想。针对这个特点要系统化学习,…

【区块链】区块链技术学习总结

文章目录 一、区块链技术简介1.1 区块链概念1.2 区块链应用1.2.1 区块链1.0技术:比特币1.2.2 区块链2.0技术:以太坊1.2.3 区块链3.0技术:价值互联网 二、区块链1.0技术比特币2.1 比特币2.1.1 比特币概念2.1.2 比特币性质2.1.3 比特币解决的问…

注意力机制综述

注意力最近几年在深度学习各个领域被广泛使用,无论是图像分割、语音识别还是自然语言处理的各种不同类型的任务中,注意力机制都在其中大放异彩 介绍 注意力(attention)机制最初应用于机器翻译任务,现在已被广泛地应用…

注意力机制原理

Attention机制在近几年来在图像,自然语言处理等领域中都取得了重要的突破,被证明有益于提高模型的性能。Attention机制本身也是符合人脑和人眼的感知机制,这次我们主要以计算机视觉领域为例,讲述Attention机制的原理,应…

GAM注意力机制

1.GAM注意力机制: 图像解析: 从整体上可以看出,GAM和CBAM注意力机制还是比较相似的,同样是使用了通道注意力机制和空间注意力机制。但是不同的是对通道注意力和空间注意力的处理。 2.CBAM注意力解析 CBAM CAM BAM 对于通道注意…

注意力机制详解系列(三):空间注意力机制

👨‍💻作者简介: 大数据专业硕士在读,CSDN人工智能领域博客专家,阿里云专家博主,专注大数据与人工智能知识分享。 🎉专栏推荐: 目前在写CV方向专栏,更新不限于目标检测、OCR、图像分类、图像分割等方向,目前活动仅19.9,虽然付费但会长期更新,感兴趣的小伙伴可以…

注意力机制+注意力汇聚

学习《动手学习深度学习》注意力机制 之后,简单做个总结。 注意力提示 假设坐在一个物品很多的房间里,我们容易受到比较显眼的物品的吸引,进而将注意力倾注在那个物品上,这样我们就忽略了周围物品;换一种情形&#x…

LSTM(RNN)中的注意力机制

一、示例代码 目的是让网络“注意”到 index2 的特征 """ 参考: https://blog.csdn.net/weixin_44791964/article/details/104000722?spm1001.2014.3001.5501 """import matplotlib.pyplot as plt import numpy as np import pand…

Tensorflow (6) Attention 注意力机制

参考: 细讲 | Attention Is All You Need 关于注意力机制(《Attention is all you need》) 一步步解析Attention is All You Need! - 简书(代码) The Illustrated Transformer – Jay Alammar – Visualizing machine learnin…