算法笔记(六)多尺度特征融合之FPN/PANet

article/2025/9/19 16:24:59

前言

最近论文快deadline了,一直没空更新…今天复习一下多尺度特征融合的常用操作。

1. FPN 特征金字塔

论文:feature pyramid networks for object detection 论文链接

设计思路:

  • 底层的特征语义信息比较少,但是目标位置准确。
  • 高层的特征语义信息比较丰富,但是目标位置比较粗略。

模型设计:自底向上Bottom-up,自顶向下Top-down,横向连接Lateral connection。
在这里插入图片描述

  • 自底向上:特征图随着左半部分的网络的加深,尺寸会不断变小,语义信息会更加丰富,这里是将每个stage(尺寸不变的网络集合为一个stage)的最后一个特征图构成特征金字塔。
  • 自顶向下:通过upsampling的方法,不断放大特征图,使得低层特征也包含丰富的语义信息。
  • 横向连接:将上采样的结果和自底向上生成的相同大小的特征图进行融合。即:从左边过来的特征图,先经过1*1的卷积操作,然后与上面下来的特征图相加(element-wise addition),之后再经过3*3的卷积能得到本层的特征输出(消除上采样产生的混叠效应aliasing effect:插值生成的图像灰度不连续,在灰度变化的地方可能出现明显的锯齿状)。

FPN+RPN

原先的RPN网络,输入的是经过主干网络提取的特征图(单尺度),设置的anchor有3种尺寸,3种宽高比,故有9种anchor:

加入了FPN后,RPN的输入是多尺度特征图,也就是每一层特征图后连接一个RPN head,因为已经有多尺度特征图了,就不需要设置另外3种尺寸,故有15种anchor:

FPN+ROI

ROI的作用是将输入的(检测框,整特征图)进行pooling,得到相同尺寸的目标特征图。使用了FPN之后,就有了多尺度特征图,考虑到实际目标有大有小,所以使用下公式判断将哪一层的特征图输入到ROI中:
k = ⌊ k 0 + l o g 2 ( w ∗ h 224 ) ⌋ k=\lfloor{k_0+log_2(\frac{\sqrt{w*h}}{224})}\rfloor k=k0+log2(224wh )
其中, k k k代表特征图的层数编号。

2. PANet

Pyramid Attention Networks for Image Restoration
论文地址

PANet是FPN(图a)的拓展,PANet创新点在于:

  1. 加入了自底向上路线增强;
  2. 加入了自适应特征池化。
  • Bottom-up Path Augmentation
    可以看到图(a)的FPN是自顶向下路线,通过侧向连接,将高层的强语义特征传递下来,只增强了特征金字塔的语义信息。例如,当底层特征到到P5时(红线),中间经过非常多层的网络(100+),此时底层的目标信息已经非常模糊了,因此扩展了FPN,加入了自底向上的路线(绿色路线,底层->P2->N2~N5,其中经过的路径少于10层),弥补并加强了定位信息。

  • Adaptive Feature Pooling
    前文中,使用FPN+ROI的方法是使用公式来选择FPN的特征图(P2~P5)的其中之一(例如小尺寸选择P2,大尺寸选择了P5)作为ROI的输入,而这种方法实际上也是单层的特征图。在这里,作者对多个特征图(N2~N5)和目标框进行ROI,然后对多个ROI结果(4个),分别经过全连接(fc1)后,再进行融合(sum、max、product等),如图所示:

参考

https://zhuanlan.zhihu.com/p/62604038


http://chatgpt.dhexx.cn/article/Jk39wGsJ.shtml

相关文章

PANet:YOLOv4中的路径聚合网络

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶” 作者:Miracle R 编译:ronghuaiyang 导读 非常简单高效的特征金字塔模块。 是最重要的计算机视觉过程之一,它将图像分割成更小的、多个片段,这样的…

PANet 学习笔记

PANet是18年的一篇CVPR,作者来自港中文,北大,商汤与腾讯优图,PANET可看作Mask-RCNN,是在Mask-RCNN基础上做的几处改进。 Introduce 解决问题: 当前实例分割最佳模型Mask-RCNN的信息传播还不够充分&#…

[小样本图像分割]PANet: Few-Shot Image Semantic Segmentation with Prototype Alignment

PANet:基于原型对齐的Few Shot图像语义分割(ICCV19) 论文地址 开源代码 摘要 本文从度量学习的角度来解决Few Shot Segmentation问题,提出一种新的原型对齐网络来更好地利用支持集信息。PANet从嵌入空间内的一些支持图像中学习特定类的原型…

PANet:基于金字塔注意力网络的图像超分辨率重建(Pytorch实现)

PANet:基于金字塔注意力网络的图像超分辨率重建 [!] 为了提高代码的可读性,本文模型的具体实现与原文具有一定区别,因此会造成性能上的差异 文章目录 PANet:基于金字塔注意力网络的图像超分辨率重建1.相关资料2.简介3.模型结构4.…

resnet50、FPN、Panet结构及代码

起初faster-r-cnn,只采用最后一层特作为rpn以及head部分的特征图 ,后来不断改进,有了FPN, 再后来有了Panet,一般来说网络的层数越深它的语义信息越丰富。但是随着网络层数的加深,检测所需的位置信息就会越差…

实例分割--(PANet)Path Aggregation Network for Instance Segmentation

PANet Path Aggregation Network for Instance Segmentation 收录:CVPR2018(IEEE Conference on Computer Vision and Pattern Recognition) 相关: COCO2017/CityScapes instance segmentation 第一 论文提出了PANet,在Mask R-CNN的基础上…

PANet路径聚合

是最重要的计算机视觉过程之一,它将图像分割成更小的、多个片段,这样的话,目标的表示和进一步的分析就变得简单。这个过程有各种各样的应用,从在医学图像定位肿瘤和发展机器视觉中的生物测量识别的目标检测。图像分割过程主要分为…

PANet 实例分割

Path Aggregation Network for Instance Segmentation(PANet) 用于实例分割的路径聚合网络 代码:https://github.com/ShuLiu1993/PANet CVPR2018 Spotlight paper, coco2017实例分割第一名目标检测第二名 当前实例分割最佳模型Mask-RCNN的…

计算机视觉——day95 PANet:基于样本原型对齐的Few-Shot图像语义分割

PANet:基于样本原型对齐的Few-Shot图像语义分割 1. Introduction2. Related workFew-shot segmentation 3. Method3.1. Problem setting3.2. Method overview3.3. Prototype learning(原型学习)3.4. 非参数度量学习3.5. 原型对准正则化(PAR) 4. Experime…

PANet(2018)

关键:根据提议的ROI在每层特征图上都裁剪相应区域的特征,然后池化为指定大小,然后用max将特征融合。使用融合后的特征做预测 Abstract: 神经网络中信息的流通路径很重要。我们提出PANet,通过增加从最底层到最上层的信息传输路径&…

PANet网络简介

个人总结 简介Bottom-up Path Augmentation待解决: Adaptive Feature Pooling待解决: Fully-connected Fusion 先上论文链接: https://arxiv.org/abs/1803.01534 欢迎交流 简介 这篇论文总体上是Mask-Rcnn的改进版本,整体思路是…

PANet[详解]

一、Abstract摘要&Introduction介绍 Abstract 信息在神经网络中的传播方式非常重要。本文提出了一种基于提议的实例分割框架下的路径聚合网络Path Aggregation Network (PANet),旨在促进信息的流动。具体地说,我们通过自底向上的路径增强&#xff…

深度学习论文导航 | 07 PANet:用于实例分割的路径聚合网络

文章目录 一、PANet简介二、整体结构分析2.1 自底向上的路径增强2.2 自适应特征层2.3 全连接融合层 三、性能表现3.1 在COCO上的测试效果3.2 在Cityscapes 和 MVD上的测试效果 四、总结 前言: 同图像识别、目标检测一样,实例分割也是最重要和最具挑战性的…

(论文阅读)实例分割之PANet

PANet 一、论文简介1.1、论文和代码链接1.2、论文基本信息 二、详细解读2.1、摘要2.2、介绍2.3、网络架构2.4、改进与创新2.5、实验结果2.6、使用的数据集 三、总结与思考 一、论文简介 1.1、论文和代码链接 paper:http://xxx.itp.ac.cn/pdf/1803.01534.pdf code:https://cod…

AI大视觉(十七) | PANet(路径聚合网络)

本文来自公众号“AI大道理”。 这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 ​ 目标检测或者实例分割不仅要关心语义信息,还要关注图像的精确到像素点的浅层信息。 所以需要对骨干网络中的网络层进行融合,使其同时…

深度学习-路径聚合网络(PANet网络)

文章目录 1、概括2、介绍3、特征金字塔网络(FPN)4、PANet5、改进点 1、概括 信息在神经网络中的传播方式非常重要。为了促进信息的流动,提出了一种基于提议的实例分割框架下的路径聚合网络Path Aggregation Network (PANet)。具体地说,我们通过自底向上…

Linux | Strace使用

文章目录 1、strace的基本介绍2、strace的使用实例2.1、直接运行结果2.2、strace追踪系统调用(strace ./test)2.3、strace跟踪信号传递2.4、系统调用统计使用-c参数,它会将进程的所有系统调用做一个统计分析展示出来-o选项重定向输出-T选项对系统调用进行计时系统调…

linux下strace的使用

strace是一款用于跟踪Linux系统调用和信号的工具,可以帮助开发者排除程序运行时的问题。 具体来说,strace可以跟踪一个程序执行时所涉及到的系统调用,包括读写文件、网络通信、进程管理、内存管理等操作,通过分析程序运行过程中发…

linux strace命令--跟踪系统调用

简介 strace常用来跟踪进程执行时的系统调用和所接收的信号。 在Linux世界,进程不能直接访问硬件设备,当进程需要访问硬件设备(比如读取磁盘文件,接收网络数据等等)时,必须由用户态模式切换至内核态模式,通 过系统调用…

Linux常用命令——strace命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) strace 跟踪系统调用和信号 补充说明 strace命令是一个集诊断、调试、统计与一体的工具,我们可以使用strace对应用的系统调用和信号传递的跟踪结果来对应用进行分析,以达到解决问题或者…