PANet路径聚合

article/2025/9/19 17:03:07

图片

是最重要的计算机视觉过程之一,它将图像分割成更小的、多个片段,这样的话,目标的表示和进一步的分析就变得简单。这个过程有各种各样的应用,从在医学图像定位肿瘤和发展机器视觉中的生物测量识别的目标检测。图像分割过程主要分为两个部分:Semantic segmentationInstance segmentation

语义分割是指将图像中的像素分类为有意义的目标类别,如天空、道路或公共汽车。

实例分割包括以像素级识别、分类和定位图像中出现的各种实例(对象),并要求保留图像中出现的最精细的特征。它是目标检测过程中最复杂的任务之一。过去,Mask R-CNN是最常用的实例分割技术。单阶段目标测器技术YOLO3使用了特征金字塔。在YOLO的最近的一个版本YOLOv4中,使用了一种新的方法来分割实例,称为Path Aggregation NetworkPANet或简称为PAN。让我们更详细地了解一下这项技术。

PANet:

PANet位在于YOLOv4模型的neck,主要通过保留空间信息来增强实例分割过程。

图片

PANet的性质

YOLOv4中选择PANet进行实例分割的原因是它能够准确地保存空间信息,有助于正确定位像素点,形成mask。

图片

使PANet如此准确的特性有:

1. 从底到上的路径增强

图片

当图像经过神经网络的各个层时,特征的复杂度增加,同时图像的空间分辨率降低。因此,像素级mask无法通过高层次的特征准确的识别。

YOLOv3中使用的FPN使用自顶向下的路径来提取语义丰富的特征并将其与精确的定位信息结合起来。但对于为大目标生成mask,这种方法可能会导致路径过于冗长,因为空间信息可能需要传播到数百个层。

另一方面,PANet使用另一条自底向上的路径,而FPN采用的自顶向下的路径。通过使用从底层到顶层的横向连接,这有助于缩短路径。这就是所谓的**“shortcut”**连接,它只有大约10层。

2. 自适应特征池化

图片

以前使用的技术,如Mask-RCNN使用单一阶段的特征来做mask预测。如果感兴趣区域较大,则使用ROI Align Pooling从较高层次提取特征。虽然相当准确,但这仍然可能导致不希望的结果,因为有时两个proposals只有10像素的差异,但是分配到了两个不同的层,而实际上它们是非常相似的proposals。

为了避免这种情况,PANet使用来自所有层的特征,并让网络决定哪些是有用的。对每个特征图进行ROI对齐操作,提取目标的特征。接下来是元素级的最大融合操作,以使网络适配新的特征。

3. 全连接融合

图片

在Mask-RCNN中,使用FCN来代替全连接层,因为它保留了空间信息,减少了网络中的参数数量。然而,由于所有空间位置的参数都是共享的,模型实际上并没有学会如何使用像素位置来进行预测,默认情况下,它会在图像的顶部显示天空,在底部显示道路。

另一方面,全连接层是位置敏感的,可以适应不同的空间位置。

PANet使用来自这两层的信息来提供更准确的mask预测。

YOLOv4的改进

PANet通常使用自适应特征池化将相邻的层相加到一起进行mask预测。但是,在YOLOv4中使用PANet时,这种方法做了点修改,例如,不是相加相邻的层,而是对它们应用一个拼接操作,以提高预测的准确性。

图片

性能分析

使用ResNet-50骨干,使用多尺度图像进行训练,PANet超过了Mask-RCNN和2016年冠军,并且在2017年COCO实例分割挑战中也获得了冠军,在不需要大batch训练的目标检测任务中排名第二。

图片

在Cityscapes数据集上,它的表现也一直优于Mask-RCNN。经过COCO的预训练,该模型能够比Mask-RCNN高出4.4个百分点。

图片

YOLOv4采用了PANet,由于其简单的实现和高性能,提高了预测的准确性,速度是EfficientDet的两倍。

图片

从APs来看,YOLOv4取得AP值为43.5% (65.7% AP₅₀)在MS COCO数据集上,并在Tesla V100上实现了~ 65帧/秒的实时的速度,使其成为最快和最准确的检测器。由于包含了PANet而不是YOLOv3中使用的FPN,YOLOv4的性能提高了10-12% !

图片

总结

PANet是快速、简单和非常有效的。它包含可以通过管道聚合的信息的组件。它对所有level的特征进行池化,缩短了最低层和顶层之间的距离。并且使用增强路径来丰富每个级别的特征。

在YOLOv4中测试时,它显示出了令人惊叹的结果,并大大提升了特征提取过程,保证了它在YOLOv4模型的neck的位置。

link


http://chatgpt.dhexx.cn/article/CNSTWahc.shtml

相关文章

PANet 实例分割

Path Aggregation Network for Instance Segmentation(PANet) 用于实例分割的路径聚合网络 代码:https://github.com/ShuLiu1993/PANet CVPR2018 Spotlight paper, coco2017实例分割第一名目标检测第二名 当前实例分割最佳模型Mask-RCNN的…

计算机视觉——day95 PANet:基于样本原型对齐的Few-Shot图像语义分割

PANet:基于样本原型对齐的Few-Shot图像语义分割 1. Introduction2. Related workFew-shot segmentation 3. Method3.1. Problem setting3.2. Method overview3.3. Prototype learning(原型学习)3.4. 非参数度量学习3.5. 原型对准正则化(PAR) 4. Experime…

PANet(2018)

关键:根据提议的ROI在每层特征图上都裁剪相应区域的特征,然后池化为指定大小,然后用max将特征融合。使用融合后的特征做预测 Abstract: 神经网络中信息的流通路径很重要。我们提出PANet,通过增加从最底层到最上层的信息传输路径&…

PANet网络简介

个人总结 简介Bottom-up Path Augmentation待解决: Adaptive Feature Pooling待解决: Fully-connected Fusion 先上论文链接: https://arxiv.org/abs/1803.01534 欢迎交流 简介 这篇论文总体上是Mask-Rcnn的改进版本,整体思路是…

PANet[详解]

一、Abstract摘要&Introduction介绍 Abstract 信息在神经网络中的传播方式非常重要。本文提出了一种基于提议的实例分割框架下的路径聚合网络Path Aggregation Network (PANet),旨在促进信息的流动。具体地说,我们通过自底向上的路径增强&#xff…

深度学习论文导航 | 07 PANet:用于实例分割的路径聚合网络

文章目录 一、PANet简介二、整体结构分析2.1 自底向上的路径增强2.2 自适应特征层2.3 全连接融合层 三、性能表现3.1 在COCO上的测试效果3.2 在Cityscapes 和 MVD上的测试效果 四、总结 前言: 同图像识别、目标检测一样,实例分割也是最重要和最具挑战性的…

(论文阅读)实例分割之PANet

PANet 一、论文简介1.1、论文和代码链接1.2、论文基本信息 二、详细解读2.1、摘要2.2、介绍2.3、网络架构2.4、改进与创新2.5、实验结果2.6、使用的数据集 三、总结与思考 一、论文简介 1.1、论文和代码链接 paper:http://xxx.itp.ac.cn/pdf/1803.01534.pdf code:https://cod…

AI大视觉(十七) | PANet(路径聚合网络)

本文来自公众号“AI大道理”。 这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 ​ 目标检测或者实例分割不仅要关心语义信息,还要关注图像的精确到像素点的浅层信息。 所以需要对骨干网络中的网络层进行融合,使其同时…

深度学习-路径聚合网络(PANet网络)

文章目录 1、概括2、介绍3、特征金字塔网络(FPN)4、PANet5、改进点 1、概括 信息在神经网络中的传播方式非常重要。为了促进信息的流动,提出了一种基于提议的实例分割框架下的路径聚合网络Path Aggregation Network (PANet)。具体地说,我们通过自底向上…

Linux | Strace使用

文章目录 1、strace的基本介绍2、strace的使用实例2.1、直接运行结果2.2、strace追踪系统调用(strace ./test)2.3、strace跟踪信号传递2.4、系统调用统计使用-c参数,它会将进程的所有系统调用做一个统计分析展示出来-o选项重定向输出-T选项对系统调用进行计时系统调…

linux下strace的使用

strace是一款用于跟踪Linux系统调用和信号的工具,可以帮助开发者排除程序运行时的问题。 具体来说,strace可以跟踪一个程序执行时所涉及到的系统调用,包括读写文件、网络通信、进程管理、内存管理等操作,通过分析程序运行过程中发…

linux strace命令--跟踪系统调用

简介 strace常用来跟踪进程执行时的系统调用和所接收的信号。 在Linux世界,进程不能直接访问硬件设备,当进程需要访问硬件设备(比如读取磁盘文件,接收网络数据等等)时,必须由用户态模式切换至内核态模式,通 过系统调用…

Linux常用命令——strace命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) strace 跟踪系统调用和信号 补充说明 strace命令是一个集诊断、调试、统计与一体的工具,我们可以使用strace对应用的系统调用和信号传递的跟踪结果来对应用进行分析,以达到解决问题或者…

【转】strace命令详解

Article1: strace是什么? 按照strace官网的描述, strace是一个可用于诊断、调试和教学的Linux用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。 strace底层使用内核的ptrace特性来实现其…

强大的strace命令用法详解

strace是什么? 按照strace官网的描述, strace是一个可用于诊断、调试和教学的Linux用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。 strace底层使用内核的ptrace特性来实现其功能。 在运维的日常工作…

Linux命令之strace命令

一、命令简介 strace是一个有用的诊断、指导和调试工具。系统管理员、诊断专家和故障解决人员将发现,对于解决源代码不易获得的程序的问题,这是非常宝贵的,因为它们不需要重新编译以跟踪它们。学生、黑客和过分好奇的人会发现,通过…

strace命令使用分析

strace命令介绍与用法 1.1 strace概述 在操作系统中,进程分为用户态进程和内核态进程,应用程序运行在用户态,内核态负责对资源包括网络,磁盘,内存等管理,用户态进程要访问这些资源时,需要通过…

【已解决】安装Ubuntu时怎样分区--利用EasyBCD在win7下进行ubuntu安装(双系统)时遇到报错:没有根文件系统,请回到分区菜单以修正此错误

由于我们离不开Windows操作,并且因为不熟悉而不习惯ubuntu的操作方式,固采用Win7和Ubuntu双系统方式比较合理。在Win7基础上安装Ubuntu,Ubuntu会自动建立一个启动菜单,让我们在开机时自行选择启动Win7还是Ubuntu。 1、在win7上安…

根文件系统挂载过程—基于linux3.10

本文基于linux3.10某一嵌入式系统,该文件系统的配置选项设置如下: 图1.1 根文件系统配置选项设置 两行配置如下: [*] Initial RAMfilesystem and RAM disk (initramfs/initrd) support (usr/rootfs.cpio.gz)Initramfs source file(s) 这两…

JFFS2根文件系统制作

一.根文件系统简介 根文件系统首先是内核启动时所mount的第一个文件系统,内核代码映像文件保存在根文件系统中,系统引导启动程序会在根文件系统挂载之后从中把一些初始化脚本(如inittab、rcS)和服务加载到内存中去运行。 文件系统…