【MFEN:轻量级多尺度特征提取:SR网络】

article/2025/9/29 21:37:32

MFEN: Lightweight multi-scale feature extraction super-resolution network in embedded system

(MFEN:嵌入式轻量级多尺度特征提取超分辨率网络)

深度卷积神经网络(CNN)在超分辨率(SR)方面取得了显著的成绩。然而,基于深度神经网络的方法由于计算量大、内存消耗大,很难应用于嵌入式便携设备。针对上述问题,通过构造多尺度特征提取块(multi-scale feature extraction blocks (MFEB)),提出了一种有效的轻量级多尺度特征提取超分辨率网络(multi-scale feature extraction super-resolution network (MFEN)),逐步获取多尺度和层次信息。此外,我们还提出了一种有效的渐进特征融合(progressive feature fusion (PFF))策略来聚合多尺度信息特征。在基准数据集上的定性和定量评价结果表明,该方法的性能优于大多数现有方法.此外,MFEN算法的计算复杂度和运行时间显著降低,为嵌入式设备的实时图像处理技术提供了便利。

介绍

单幅图像超分辨率(SISR)是指从原始的低分辨率(LR)图像重建出相应的高分辨率(HR)图像。它是病态的,因为相同的LR图像对应于多个HR图像。超分辨率技术在嵌入式系统、监控、医疗诊断等领域具有重要的应用价值,是一个值得深入研究的领域。
近年来,深度卷积神经网络(CNN)方法在SR重构中取得了显著的效果,这些方法证实了深度卷积神经网络具有更好的重构性能。因此,各种SR网络试图建立更深的网络以获得更好的重建图像。尽管大多数深度SR网络取得了突出的性能,但由于其计算量巨大和过程复杂而无法用于实际应用。因此,发展轻量级网络是非常必的。
在已有的轻量级CNN研究中,LapSRN将拉普拉斯金字塔结构引入到超分辨率网络中。MemNet建立了一个端到端的持久内存模型。采用跳连接的方式来降低整个网络的权重。CARN采用递归级联机制来集成不同层的功能。它可以通过共享参数使网络更有效。IDN引入了一种信息提取机制网络,利用多个堆叠的信息提取块直接从原始LR图像重建HR图像。虽然这些方法可以减少SR网络的参数,但在计算复杂度和模型性能上仍有改进的空间。
为了改进现有的模型,我们设计了一个高效的轻量级SR网络。受人工压缩和设计模型思想的启发,提出了一种轻量级多尺度特征提取网络(MFEN)。不同于以往大多数SR网络采用固定尺度提取图像特征,本文设计了一个多尺度特征提取模块(MFEB)来获取多尺度信息。具体而言,该块从不同比例提取包含更详细信息的特征。然而,多尺度特征提取的操作通常会增加参数和计算复杂度。此外,如图1所示,我们发现同一层的特征具有很大的相似性。在所有通道的卷积运算中存在冗余。将提取出的浅层特征分为三部分进行不同尺度的操作,设计出更加轻量化的模型。结果,我们从不同的输入通道获得了三个特征类别。有必要考虑一种合适的融合策略来控制信息流。
在这里插入图片描述

贡献

1)为了实现快速的图像超分辨率,我们设计了一种轻量级的多尺度特征提取块(MFEB)网络MFEN。在每个MFEB中,所有特征通道被分成三部分,分别送入具有不同核函数的卷积层,以获得多尺度信息。该网络能在有效保留图像特征的同时重建出更好的HR图像。
2)为了有效地融合不同尺度下的特征,提出了一种渐进式特征融合(PFF)策略.相同的规模特点是逐步集成利用级联和通道洗牌层。该策略可以有效地混合不同信道间的信息。
3)为了更加轻量级,我们还在MFEN的基础上提出了一个更简单的网络MFEN_S。在该网络中,MFEB中的分裂操作的数目减少到3,而网络宽度保持不变。实验结果表明,这种简单的网络也能获得性能提升。

相关工作

Deep super-resolution models

近年来,基于深度神经网络的模型在SR。Dong等人取得了显著的成果,Dong等人首先将深度学习引入到超分辨率中,该方法应用三层卷积直接得到LR到HR的映射。VDSR利用20层CNN结构来构建深度模型。采用残差学习的方法来降低训练难度。DRCN和DRRN 通过共享权重减少了参数数量。SAN提出了一种二阶注意机制,用于更有效地聚合特征。SRFBN充分利用了反馈机制,以较少的参数提高了重构能力。Meta-SR引入了元学习的思想,这是第一次尝试仅通过单个模型来实现对LR的任意尺度的上采样。端到端可训练USRNet提供了一种弥合传统和深度学习模型之间差距的方法。UDVD 为变分退化引入了统一的动态卷积。它可以适应图像之间的变化(跨图像变化)和图像内的变化(空间变化)。虽然这些深度SR网络可以获得显著的重构结果,但是它们带来了计算复杂度和存储器存储成本。

Lightweight super-resolution models

深度学习模型由于计算量大,无法应用于实际应用。于是简单高效的轻量级模型成为一种发展趋势。有三种方法可以简化神经网络:压缩模型、人工设计网络和基于神经结构搜索(NAS)的自动设计。就压缩模型方式而言,主要是使权重最小化。Han等人提出了模型压缩技术,包括修剪、量化和知识提取。在SR字段中,DRCN 和DRRN 分别共享卷积层和残差结构中的参数以压缩模型。知识蒸馏使用小型网络来模拟大型网络的性能。人工设计网络方式主要集中在设计更高效的架构上。人工设计的轻量级网络通过去除不必要的操作或引入更有效的卷积操作来构造更有效的结构。它可以保持与深度神经网络相同的优良性能。对于基于神经结构搜索(NAS)的自动设计方式,Google首先设计了NAS的思路,即利用一定的搜索策略从搜索空间中选择一个模型,然后对该模型的效果进行评估。FALSR将NAS引入SR领域以获得优异的性能。通过将NAS与修剪搜索相结合,开发了用于实时SR的自动搜索框架。虽然这些方法可以降低SR网络的复杂度和参数,但仍有一些问题值得进一步研究。

方法

随着网络的不断深入,大多数方法忽略了网络对多尺度信息的适应性。在该网络中,我们设计了一种基于多尺度特征提取的轻量级网络,以更好地利用多尺度信息。首先,利用通道分裂将特征图分成三个分支,得到不同尺度的特征信息。然后,我们应用多层卷积层来获得层次特征。最后,提出了PFF策略来聚合多尺度、多层次的特征,最大限度地提高了提取特征的利用率。与现有的网络相比,我们设计的网络减少了便携式设备和实时图像处理中的参数和运行时间。

Basic network structure

请添加图片描述

大多数神经网络选择通过叠加具有固定卷积核大小的卷积层来加深网络层,以获得更有说服力的信息。由于多尺度特征和层次特征对HR重建工作同样重要,我们提出了一种多尺度特征提取网络。在本节中,我们详细描述了所设计的结构。如图2所示,我们的MFEN包含三个组件:浅层特征提取、堆叠的多尺度特征提取块(MFEB)和重建模块。
具体地,将输入LR图像𝐼𝐿𝑅发送到3 × 3卷积层以获得浅特征:
请添加图片描述
其中𝐹𝑠𝑎𝑙𝑙𝑜𝑤表示浅层特征,𝐹0(·)是特征提取函数。我们设计了一个具有堆叠的M个MFEB的多尺度特征提取模块。前一个块的输出被发送到下一个块。通过这种方式,特征被依次转移,其可以被公式化为:请添加图片描述
其中𝐹𝐵是第M个模块的输出。𝐵𝑘(·)表示第k个MFEB函数(k = 1,2,…,M)。最后𝐹𝐵,将其发送到最后一个重建模块。在上采样之后,获得最终SR图像𝐼𝑆𝑅在这里插入图片描述
我们利用L1损耗函数来优化网络。LR和对应的地面实况(ground truth (GT))图像被分别划分为N个块。损失函数可表示为:
在这里插入图片描述

Multi-scale feature extraction block

在多尺度上表示特征有助于重构局部信息和上下文信息。以往的网络大多同时提取所有特征,使得重建过程中信息丢失。考虑到利用多尺度提取可以在去除特征单一性的同时获得丰富的层次特征,提出了多尺度特征提取算法MFEB。MFEB的特殊性在于提取操作是在不同的特征通道中独立进行的。如图3所示,我们提出的MFEB执行四个渐进通道分割操作以获得多尺度信息,同时减少参数和计算。MFEN_S中有三次。每一步将输入特征按一定比例分为三个提取部分:低尺度、中尺度、高尺度的信息提取渠道。在验证实验中获得该分流比𝛼。请添加图片描述

给定浅层特征提取模块的输出𝐹𝑠𝑎𝑙𝑙𝑜𝑤,其被发送到第一分裂操作。这个过程可以描述为:在这里插入图片描述
最后,将得到的多尺度聚合特征送入1 × 1卷积层,保证块的输入和输出通道一致。最后,使用注意机制层,可以更好地抑制无用信息,以获得更好的结果:
在这里插入图片描述

其中A(⋅)表示挤压和激励(SE)块。𝐹𝑓𝑢𝑠𝑖𝑜𝑛 分别𝐹𝐵表示多尺度特征融合的结果和最终块的输出。

Feature fusion strategy

标准的特征融合方法直接将不同尺度的特征进行融合,称为直接特征融合(DFF)。一般来说,它往往导致充分信息的丢失和无效信息的重叠。同时,我们还考虑了组特征融合(GFF)方法,将相同尺度的特征作为同一组进行融合。该融合方法比DFF方法具有更好的融合效果。通过GFF,我们得到了三种不同的融合特征,这三种特征都不利于重建单幅图像。提出一种渐进特征融合(PFF)方法来有效地融合层次和多尺度特征。具体地,在第二分割操作之后,融合从第一分割和第二分割获得的相同比例的特征。然后,将结果与从第三分离获得的特征融合。以此类推,得到最终的融合特征。对于给定的不同尺度的提取特征𝐹𝐿𝑛、𝐹𝑀𝑛和𝐹𝐻𝑛,融合过程可以在数学上写为:
在这里插入图片描述
其中𝐹𝐿𝑜𝑢𝑡𝐹𝑀𝑜𝑢𝑡,𝐹𝐻𝑜𝑢𝑡分别表示不同尺度下的级联和信道混洗后的融合特征。下标t是MFEB中的第t次卷积运算(t = 2,3,…,T)。
最后的融合运算公式为:
在这里插入图片描述
其中𝐹𝐵是最终融合结果,我们在MFEN中设置T等于4,在MFEN_S中设置T等于3。实验结果表明,PFF能够充分利用提取的特征信息。图4显示了不同的特异性融合策略。请添加图片描述

实验


http://chatgpt.dhexx.cn/article/SrfTA6hy.shtml

相关文章

深度学习笔记---多尺度网络结构归类总结

目录 1.什么是图像金字塔 1.1 高斯金字塔 ( Gaussian pyramid): 1.2 拉普拉斯金字塔(Laplacian pyramid) 1.3 DOG金字塔 2. 多尺度网络(MTCNN) 2.1 多尺度输入网络 2.2 多尺度特征融合网络 2.2.1 并行多分支网络 2.2.2 串行…

【边缘注意:深度多尺度特征】

Learning a Deep Multi-Scale Feature Ensemble and an Edge-Attention Guidance for Image Fusion (学习深度多尺度特征集成和图像融合的边缘注意指南) 在本文中,我们提出了一种用于红外和可见光图像融合的深度网络,该网络将具…

多尺度特征的提取

1、图像金字塔 将图片进行不同尺度的缩放,得到图像金字塔,然后对每层图片提取不同尺度的特征,得到特征图。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得&…

MSRN(多尺度超分辨率重建)

目前的研究倾向于使用更深层次的卷积神经网络来提高性能。然而,盲目增加网络深度不能有效改善网络。更糟糕的是,随着网络深度的增加,训练过程中出现了更多的问题,需要更多的训练技巧。在本文中,我们提出了一种新颖的多尺度残差网络 (MSRN) 来充分利用图像特征,该网络优于…

【multi_scale】多尺度训练——目标检测训练trick

文章目录 1 多尺度训练的介绍2 代码解析3 感谢链接 1 多尺度训练的介绍 多尺度训练对全卷积网络有效,在训练时,每隔一定的 iterations,在一定尺寸范围内,随机选取一种 img_size 进行训练。通过对不同尺度的图像进行训练&#xff…

“多尺度”目标检测问题

一、“多尺度”目标检测问题简介 在目标检测任务中,被测目标的大小经常是不固定的,自动驾驶相关检测任务可能要同时检测大卡车与小狗;工业质检相关检测任务可能要同时检测布料的大面积撕裂与小穿孔;医疗病灶检测任务可能要同时检测大小不一的病灶。在被测物体尺度相差极大…

图像多尺度技术

1197 多尺度图像技术也叫做多分辨率技术(MRA),指对图像采用多尺度的表达,并且在不同尺度下分别进行处理。这样做的理由是很多情况下在一种尺度中不容易看清的或者获取的特性在另外的某种尺度下就很容易发现或者是提取。所以多尺度…

目标检测中多尺度:特征金字塔FPN_Feature Pyramid Networks for Object Detection

原始内容来源于: https://blog.csdn.net/cdknight_happy/article/details/100528127 https://blog.csdn.net/WZZ18191171661/article/details/79494534 包含理解! 参考文献:https://arxiv.org/abs/1612.03144 代码实现:http://ww…

MViTv2 多尺度视觉Transformer

虽然VIT(vision transformer)模型提出后,Transformer在CV领域一路攻城拔寨,不断刷新由自己创下的记录,但VIT文章中所说明的视觉领域transformer很大程度上受transformer模型平方复杂度的限制而在大尺度图像上表现不佳的…

综述:目标检测中的多尺度检测方法

传统卷积网络通常采用从上到下的单行结构。对于大物体而言,其语义信息将出现在较深的特征图中;而对于小物体,其语义信息出现在较浅的特征图中,随着网络的加深,其细节信息可能会完全消失。 多尺度检测也是当今物体检测领…

【笔记】多尺度方法

1.定义 2.常用架构 2.1多尺度输入网络 2.2 多尺度特征融合网络 (1) 并行多分支结构 (2) 串行多分支结构 2.3 多尺度特征预测融合 2.4 多尺度特征和预测融合 3.具体方法 3.1 SNIP 3.2 SNIPER(SNIP的改进) 3.3 SSD 3.4 TridentNet(…

多尺度多目标检测之金字塔

在日常学习工作中,经常会碰到一个概念,那就是金字塔(pyramid),本文就该概念进行一定的阐述,具体如下: (1)图像金字塔 图像金字塔结构,即对图像进行一定比例…

多尺度结构元素形态学边缘检测算法的研究-含Matlab代码

目录 一、引言二、数学形态学理论概述三、实验验证四、参考文献五、Matlab代码获取 一、引言 使用数字图像处理技术来解决计算机视觉、人工智能、生物遥感器视觉等领域所涉及到的图像问题时,最重要、最关键的一步是提取出图像中最有效、最有用的特征信息。而图像边…

多尺度熵---Understanding Multiscale Entropy

目录 导言计算多尺度熵多尺度熵在脑电分析中的应用参考文献 导言 多尺度熵(Multiscale entropy, MSE)将样本熵扩展到多个时间尺度,以便在时间尺度不确定时提供额外的观察视角。样本熵的问题在于它没有很好地考虑到时间序列中可能存在的不同时…

多尺度排列熵

文章目录 前言一、什么是多尺度排列熵?二、实验平台照片三、MATLAB代码3.1 多尺度排列熵3.2 排列熵 参考文献 前言 齿轮及齿轮箱作为机械设备常用的调节转速和传递转矩的旋转机械设备,不仅能够传递较大的功率和载荷,而且具有较好的可靠性。但…

多尺度是什么计算机视觉中 multi_SCALE

先给出定义吓死你们哈哈 多尺度,实际上就是对信号的 不同粒度 的采样 别急哈哈 粒度小,说明是一个很密集的采样,能看到更多更多的细节 而粒度粗 大 说明是一个很稀疏的采样,但是点与点之间隔得远了,就容易看到趋势了…

多尺度(multi-scale)目标检测方法

文章目录 1、多尺度图像预测2、金字塔特征预测2.1 FPN2.2 SSD 3、bounding box设计 1、多尺度图像预测 将图片进行不同尺度的缩放,得到图像金字塔,然后对每层图片提取不同尺度的特征,得到特征图。最后对每个尺度的特征都进行单独的预测。 特…

多尺度与多分辨率的理解

我一开始以为 多尺度与多分辨率 是一样的意思。后来看到了xiaowei_cqu博客的一篇文章“【OpenCV】SIFT原理与源码分析:DoG尺度空间构造”(以下简称,xiaowei一文),才发现我的理解有误。 尺度空间(scale space)理论 …

多尺度深度特征(上):多尺度特征学习才是目标检测精髓(干货满满,建议收藏)...

计算机视觉研究院专栏 作者:Edison_G 深度特征学习方案将重点从具有细节的具体特征转移到具有语义信息的抽象特征。它通过构建多尺度深度特征学习网络 (MDFN) 不仅考虑单个对象和局部上下文,还考虑它们之间的关系。 公众号ID|ComputerVisionG…

计算机视觉CV领域中多尺度特征的概念

知乎:深度学习中的多尺度模型设计 知乎:计算机视觉中的多尺度模型都有哪些设计? CSDN:多尺度理解 什么是多尺度? 所谓多尺度,实际就是对信号的不同粒度的采样。 通常在不同的尺度下我们可以观察到不同…