Neck网络 FPN + PAN 改进解读

article/2025/9/22 7:13:34

呃 这篇文章的目的在于补充一些知识以便于理解Neck部分的网络

特征提取网络 与 目标检测之间的关系

一个特征提取网络,假设有1000层,开始的特征图包含的细节信息就很多,而随着网络的加深,特征提取网络经过多次被卷积和池化操作,会逐渐抛弃原始图像中的细节信息,而更偏向于抽象的语义信息。

语义信息:

语义信息是指描述了物体的类别、形状、位置、空间关系等高层次抽象特征,比如说在图像中,猫和狗就是不同的语义信息。

 对于一个特征提取网络来说,浅层特征图,会拥有以下的特点:

较小的感受野 -----> 较少的语义信息  ------> 难以获得更广泛的上下文信息 

尺寸较大的特征图 ----> 更多的细节信息 -----> 更高的分辨率

那么同理,对于深层特征图 

会具有较大的感受野  ----->  具有较强的语义抽象能力  ----->能够获得更广泛的上下文信息(获得较为全局的特征信息)

尺寸较小的特征图   ----->  丧失较多的细节信息   ----->难以获得最够的分辨率

那么对于大目标和小目标的检测问题

相对于大目标,小目标的定位和检测更加困难一些。

由于小目标的尺寸较小,因此小目标的需要更高的分辨率和更准确的定位信息,因此更加注重图像细节的表达能力,常常采用浅层特征图来判断(浅层特征更好地捕捉图像的细节信息,包括边缘、纹理等低层次特征),深层特征图注重更高层次的语义信息提取,导致在图像的细节上缺失。

对于大目标,大目标通常具有更为明显的高层次语义信息,比如物体的形状、结构和类别,而这些信息在深层特征图中更能够清洗地表达,此外,深层特征图具有更大的感受野,能够获得更为广泛的上下文信息,也就更能把握全局特征,因此深层特征图更适合大目标的定位和检测。

简而言之,在进行目标检测和定位时,对于大目标,深层特征和大的感受野通常更加适合;而对于小目标,则需要更注重浅层特征和更高的分辨率。

插一嘴,图像的分类需要深层特征图,

而对于目标检测,则得分大目标和小目标选择合适的特征图(当然后面都是浅层信息和深层信息融合了)。

Neck 特征融合

其实看论文更好,找英翻嘛

FPN详解_技术挖掘者的博客-CSDN博客

深度学习-路径聚合网络(PANet网络)_Tc.小浩的博客-CSDN博客

对于FPN结构(细节不概述了)其实可以总结为

将处理过的低层特征和处理过的高层特征进行累加,这样做的目的是因为低层特征可以提供更加准确的位置信息,而多次的降采样和上采样操作使得深层网络的细节信息存在误差,因此我们将其结合其起来使用,这样我们就构建了一个更深的特征金字塔,融合了多层特征信息。

 看似好像我们确实深层特征图通过concat融合了低层特征图,然后似乎拥有了低层特征图的细节信息。但是如果构建很深的网络,其实即使是相对于低层的特征图也走过了很多层(这也是PANet的改进:

  • 缩短信息路径和用低层级的准确定位信息增强特征金字塔,创建了自下而上的路径增强

)。因此当一个网络深度较大,其实FPN的特征融合仍然损失了巨大的细节特征信息。

那么PANet网络的缩短信息路径是什么意思。

 我们知道P5、P4、P3融合的是主干网络里特征图(这种特征图可能已经经过了100层,只是特征图大小大而已,语义信息更多,细节信息已经较少了)。

那么我另辟一个只有降维行为通道不就行了(也就是我们的PAN)

官方的图其实需要配着文字说明才好阅读,PAN那一列其实与第一列的特征提取层数并不相同,PAN那一列只有降维而已,而N2也就是P2,N2~N5这一列,并不是主干网络的提取特征图,因此这样特征传递需要“穿越”的特征图数量大大减少,几层就到了,特征图保留的也更多的是细节信息了。

BiFPN

[Reading] EfficientDet: Scalable and Efficient Object Detection | nex3z's blog


http://chatgpt.dhexx.cn/article/ZxF4BgHY.shtml

相关文章

FPN论文笔记

FPN论文笔记 现在看FPN和Inception并行结构融合有点像,FPN上采样同时横向连接相加,Inception是堆叠几个感受野不同的feature,融合的思想有点相似。 FPN是什么? Feature Pyramid Networks,用于特征抽取(feature extr…

FPN算法一览

FPN应该是2017年CV顶会的优秀论文,基于目标检测做的研究,在小物体检测方面较为具有吸引力。 1.FPN 源论文:feature pyramid networks for object detection 参考代码:FPN 同时利用低层特征高分辨率和高层特征的高语义信息&…

目标检测中的各种FPN

早期的目标检测算法,无论是一步式的,还是两步式的,通常都是在Backbone的最后一个stage(特征图分辨率相同的所有卷积层归类为一个stage)最后一层的特征图,直接外接检测头做目标检测。此种目标检测算法&#…

FPN(在FasterRCNN里面是如何运用的)

FPN(Feature Pyramid Networks) FPN解决了什么问题? 答:FPN的提出是为了实现更好的feature maps融合,一般的网络都是直接使用最后一层的feature maps,虽然最后一层的feature maps 语义强,但是位置和分辨率都比较低&…

深度学习之FPN+PAN

一、FPN 检测不同尺度的物体具有挑战性,尤其是对于小物体,我们可以使用不同尺度的同一图像的金字塔来检测物体(下左图)但是,处理多尺度图像非常耗时并且内存需求太高而无法同时进行端到端训练,因此创建了一…

FPN全解-最全最详细

这篇论文是CVPR2017年的文章,采用特征金字塔做目标检测,有许多亮点,特来分享。 论文:feature pyramid networks for object detection 论文链接:https://arxiv.org/abs/1612.03144 论文概述: 作者提出的…

FPN和PAN的内容及区别

FPN和PAN都是用于解决在目标检测中特征金字塔网络(FPN)在多尺度检测任务上的不足的方法。下面分别详细介绍一下它们的原理和区别。 FPN FPN全称Feature Pyramid Network,是由FAIR在2017年提出的一种处理多尺度问题的方法。FPN的主要思路是通过构建金字塔式的特征图…

深度学习之FPN和PAN

注:借鉴整理,仅供自学,侵删 FPN是自顶向下,将高层的强语义特征传递下来,对整个金字塔进行增强,不过只增强了语义信息,对定位信息没有传递。PAN就是针对这一点,在FPN的后面添加一个自…

FPN网络介绍

目录 前言一.FPN网络二.网络创新点 前言 上一篇博文我们介绍了FCN结构,这篇博文我们来简答的介绍下FPN网络,FPN (Feature Pyramid Network) 是一种用于图像语义分割、物体检测等任务的神经网络结构。是针对目标检测提出的结构。 一.FPN网络 先来看下FP…

FPN+PAN结构,SPP结构

一、FPNPAN FPN 高维度向低维度传递语义信息(大目标更明确) PAN 低维度向高维度再传递一次语义信息(小目标也更明确) 二、SPP 深层的feature map携带有更强的语义特征,较弱的定位信息。而浅层的feature map携带有…

FPN+PAN结构学习

yolo4的neck结构采用该模式,我们将Neck部分用立体图画出来,更直观的看下两部分之间是如何通过FPN结构融合的。 如图所示,FPN是自顶向下的,将高层特征通过上采样和低层特征做融合得到进行预测的特征图。Neck部分的立体图像&#xf…

FPN网络理解

1.什么是FPN fpn设计动机:1.高层特征向低层特征融合,增加低层特征表达能力,提升性能 2.不同尺度的目标可以分配到不同层预测,达到分而治之。 fpn设计细节:1*1的卷积是让最左侧的三个特征图的通道保持一致,从…

FPN详述

简介 为了使用更多的语义信息,目标检测模型一般在卷积神经网络最后一层的特征图上进行后续操作(随着不断地下采样,语义信息更丰富,空间信息更稀少),而这一层对应的下采样率一般是比较大的,如16…

FPN与Unet的异同

来源:目标检测的FPN和Unet有差别吗? - 知乎 (zhihu.com) 作者:CW不要無聊的風格 链接:https://www.zhihu.com/question/351279839/answer/1598104355 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业…

FPN以及其他结构FPN——Bi-FPN重点(仅供自己学习使用)

FPN FPN特征金字塔结构。 由于目标检测中对小物体检测很困难,因为卷积过程中,大物体的像素点多,小物体的像素点少,随着卷积的深入,大物体的特征容易被保留,小物体的特征越往后越容易被忽略。所以产生了FPN结…

FPN(Feature Pyramid Networks)详解

图像金字塔结构 图a 图a是在传统的图像处理当中是比较常见的一个方法。针对我们要检测不同尺度的目标时,会将图片缩放成不同的尺度,然后将每个尺度的图片依次通过我们的算法进行预测。 优点是它创建的多尺度特征的所有层次都包含很强的语义特征&#xf…

FPN解读

前两篇博客中都说到了FPN这个神器,今天就花了点时间看了下这篇论文,喜欢这个很赞很干净的结构。 Motivation 凡是都要从motivation说起,哈哈哈。rcnn系列在单个scale的feature map做检测(b),尽管conv已经对scale有些鲁棒了&#…

目标检测之FPN网络详解

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达特征图金字塔网络FPN(Feature Pyramid Networks)是2017年提出的一种网络,FPN主要解决的是物体检测中的多尺度问题,通过简单…

FPN网络

论文是CVPR2017年的文章,采用特征金字塔做目标检测,有许多亮点,特来分享。 论文链接:https://arxiv.org/abs/1612.03144 译文:https://blog.csdn.net/quincuntial/article/details/80152314 FPN解决了什么问题&…

各种FPN:PANet、ASFF、NAS-FPN、BiFPN、Recursive-FPN...

早期的物体检测算法,无论是一步式的,还是两步式的,通常都是在Backbone的最后一个stage(特征图分辨率相同的所有卷积层归类为一个stage)最后一层的特征图,直接外接检测头做物体检测。此种物体检测算法&#…