计算机视觉——day95 PANet:基于样本原型对齐的Few-Shot图像语义分割

article/2025/9/19 17:28:55

PANet:基于样本原型对齐的Few-Shot图像语义分割

  • 1. Introduction
  • 2. Related work
    • Few-shot segmentation
  • 3. Method
    • 3.1. Problem setting
    • 3.2. Method overview
    • 3.3. Prototype learning(原型学习)
    • 3.4. 非参数度量学习
    • 3.5. 原型对准正则化(PAR)
  • 4. Experiments
  • 5. Conclusion

在本文中,我们从度量学习的角度来解决具有挑战性的少镜头分割问题,并提出PANet,一个新的原型对准网络,以更好地利用支持集的信息。通过非参数度量学习,PANet提供了高质量的原型,这些原型既能代表每个语义类,又能区分不同的语义类。

1. Introduction

image-20230523130211296我们开发了一个原型对准网络(PANet)来处理少镜头分割,如图1所示。PANet首先通过共享的特征提取器将不同的前景对象和背景嵌入到不同的原型中。这样,每一个学习到的原型都是对应类的代表,同时又与其他类有足够的区别。然后,通过引用最接近其嵌入表示的类特定原型来标记查询图像的每个像素.

提出的PANet的结构设计有几个优点。首先,它没有引入额外的可学习参数,因此不容易出现过拟合。其次,在PANet中,原型嵌入和预测是在计算的特征图上进行的,因此分割不需要额外的通过网络。此外,由于正则化只在训练中进行,推理的计算成本不会增加。

2. Related work

Few-shot segmentation

Shaban等人首先提出了一种利用条件分支从支持集生成一组参数θ的少镜头分割模型,然后利用该模型对查询集的分割过程进行调优。Rakelly等人将提取的支持特征与查询特征串联起来,并使用解码器生成分割结果。Zhang et al.使用蒙面平均池来更好地从支持集中提取前景/背景信息。Hu等人的研究了网络的多个阶段的引导。这些方法通常采用参数化模块,将从支持集中提取的信息进行融合并生成分割。

相比之下,我们的模型设计更简单,更接近于原型网络。此外,我们采用晚期融合结合标注掩码,更容易推广到标注稀疏或更新的情况。

3. Method

3.1. Problem setting

3.2. Method overview

与现有的少镜头分割方法将提取的支持特征与查询特征融合,以参数化的方式生成分割结果不同,我们提出的模型旨在学习并对齐嵌入空间中每个语义类的紧凑、健壮的原型表示。然后通过非参数度量学习在嵌入空间内进行分割。image-20230523131105545如图2所示,我们的模型学习进行如下分割。对于每一段,它首先通过共享的骨干网将支持和查询图像嵌入到深层特征中。然后应用掩码平均池从支持集中获取原型,如3.3节所述。通过将每个像素标记为最近原型的类来执行查询图像的分割。在学习过程中,将在3.5节中引入一种新的原型对准正则化(PAR),以鼓励模型学习一致的嵌入原型,以支持和查询。

我们采用VGG-16网络作为特征提取器,遵循约定。保留VGG-16中前5个卷积块进行特征提取,去掉其他层。maxpool4层的步幅设置为1,以保持较大的空间分辨率。为了增加接收域,将conv5块中的卷积替换为膨胀卷积,膨胀集为2。由于提出的PAR没有引入额外的可学习参数,我们的网络经过端到端训练来优化vgg -16的权值,以学习一致的嵌入空间。

3.3. Prototype learning(原型学习)

我们的模型在原型网络的基础上,学习了包括背景在内的每个语义类的代表性和良好分离的原型表示。在本研究中,我们采用后期融合策略,因为它保持了共享特征提取器输入的一致性。

具体来说,给定支持集Si = {(Ic,k,Mc,k)},设Fc,k为网络对图像Ic,k输出的特征映射。这里c索引类,k =1,…,K对支持图像进行索引。类c的原型是通过屏蔽平均池来计算的:image-20230523131634685

其中(x, y)索引空间位置,1(·)是指示函数,如果参数为真,则输出值为1,否则输出值为0。此外,还计算了背景的原型:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oIGXOoto-1684820799451)(null)]

上述原型通过非参数度量学习端到端优化,如下所述。

3.4. 非参数度量学习

通过度量学习计算查询图像的概率映射M ~ q后,我们计算分割损失Lseg如下:image-20230523131817558

其中Mq为查询图像的地面真值分割掩模, N为空间位置总数。优化上述损失将为每个类派生出合适的原型。

3.5. 原型对准正则化(PAR)

image-20230523134435456图二,在block (b)中,提出的PAR通过执行查询到支持的少镜头分割和计算损失LPAR来对齐支持和查询的原型。GT为ground truth segmentation mask。

image-20230523134511915PANet在少镜头分割上的训练和测试过程在算法1中进行了总结。

4. Experiments

image-20230523134535458

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rWcMJxDo-1684820799574)(null)]

5. Conclusion

我们提出了一种基于度量学习的多镜头分割算法(PANet)。PANet能够从支持集中提取鲁棒原型,并使用非参数距离计算进行分割。通过提出的PAR,我们的模型可以进一步利用支持信息来辅助训练。在没有任何解码器结构或后处理步骤的情况下,我们的PANet比以前的工作表现要好得多。


http://chatgpt.dhexx.cn/article/1neqXlc3.shtml

相关文章

PANet(2018)

关键:根据提议的ROI在每层特征图上都裁剪相应区域的特征,然后池化为指定大小,然后用max将特征融合。使用融合后的特征做预测 Abstract: 神经网络中信息的流通路径很重要。我们提出PANet,通过增加从最底层到最上层的信息传输路径&…

PANet网络简介

个人总结 简介Bottom-up Path Augmentation待解决: Adaptive Feature Pooling待解决: Fully-connected Fusion 先上论文链接: https://arxiv.org/abs/1803.01534 欢迎交流 简介 这篇论文总体上是Mask-Rcnn的改进版本,整体思路是…

PANet[详解]

一、Abstract摘要&Introduction介绍 Abstract 信息在神经网络中的传播方式非常重要。本文提出了一种基于提议的实例分割框架下的路径聚合网络Path Aggregation Network (PANet),旨在促进信息的流动。具体地说,我们通过自底向上的路径增强&#xff…

深度学习论文导航 | 07 PANet:用于实例分割的路径聚合网络

文章目录 一、PANet简介二、整体结构分析2.1 自底向上的路径增强2.2 自适应特征层2.3 全连接融合层 三、性能表现3.1 在COCO上的测试效果3.2 在Cityscapes 和 MVD上的测试效果 四、总结 前言: 同图像识别、目标检测一样,实例分割也是最重要和最具挑战性的…

(论文阅读)实例分割之PANet

PANet 一、论文简介1.1、论文和代码链接1.2、论文基本信息 二、详细解读2.1、摘要2.2、介绍2.3、网络架构2.4、改进与创新2.5、实验结果2.6、使用的数据集 三、总结与思考 一、论文简介 1.1、论文和代码链接 paper:http://xxx.itp.ac.cn/pdf/1803.01534.pdf code:https://cod…

AI大视觉(十七) | PANet(路径聚合网络)

本文来自公众号“AI大道理”。 这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 ​ 目标检测或者实例分割不仅要关心语义信息,还要关注图像的精确到像素点的浅层信息。 所以需要对骨干网络中的网络层进行融合,使其同时…

深度学习-路径聚合网络(PANet网络)

文章目录 1、概括2、介绍3、特征金字塔网络(FPN)4、PANet5、改进点 1、概括 信息在神经网络中的传播方式非常重要。为了促进信息的流动,提出了一种基于提议的实例分割框架下的路径聚合网络Path Aggregation Network (PANet)。具体地说,我们通过自底向上…

Linux | Strace使用

文章目录 1、strace的基本介绍2、strace的使用实例2.1、直接运行结果2.2、strace追踪系统调用(strace ./test)2.3、strace跟踪信号传递2.4、系统调用统计使用-c参数,它会将进程的所有系统调用做一个统计分析展示出来-o选项重定向输出-T选项对系统调用进行计时系统调…

linux下strace的使用

strace是一款用于跟踪Linux系统调用和信号的工具,可以帮助开发者排除程序运行时的问题。 具体来说,strace可以跟踪一个程序执行时所涉及到的系统调用,包括读写文件、网络通信、进程管理、内存管理等操作,通过分析程序运行过程中发…

linux strace命令--跟踪系统调用

简介 strace常用来跟踪进程执行时的系统调用和所接收的信号。 在Linux世界,进程不能直接访问硬件设备,当进程需要访问硬件设备(比如读取磁盘文件,接收网络数据等等)时,必须由用户态模式切换至内核态模式,通 过系统调用…

Linux常用命令——strace命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) strace 跟踪系统调用和信号 补充说明 strace命令是一个集诊断、调试、统计与一体的工具,我们可以使用strace对应用的系统调用和信号传递的跟踪结果来对应用进行分析,以达到解决问题或者…

【转】strace命令详解

Article1: strace是什么? 按照strace官网的描述, strace是一个可用于诊断、调试和教学的Linux用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。 strace底层使用内核的ptrace特性来实现其…

强大的strace命令用法详解

strace是什么? 按照strace官网的描述, strace是一个可用于诊断、调试和教学的Linux用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。 strace底层使用内核的ptrace特性来实现其功能。 在运维的日常工作…

Linux命令之strace命令

一、命令简介 strace是一个有用的诊断、指导和调试工具。系统管理员、诊断专家和故障解决人员将发现,对于解决源代码不易获得的程序的问题,这是非常宝贵的,因为它们不需要重新编译以跟踪它们。学生、黑客和过分好奇的人会发现,通过…

strace命令使用分析

strace命令介绍与用法 1.1 strace概述 在操作系统中,进程分为用户态进程和内核态进程,应用程序运行在用户态,内核态负责对资源包括网络,磁盘,内存等管理,用户态进程要访问这些资源时,需要通过…

【已解决】安装Ubuntu时怎样分区--利用EasyBCD在win7下进行ubuntu安装(双系统)时遇到报错:没有根文件系统,请回到分区菜单以修正此错误

由于我们离不开Windows操作,并且因为不熟悉而不习惯ubuntu的操作方式,固采用Win7和Ubuntu双系统方式比较合理。在Win7基础上安装Ubuntu,Ubuntu会自动建立一个启动菜单,让我们在开机时自行选择启动Win7还是Ubuntu。 1、在win7上安…

根文件系统挂载过程—基于linux3.10

本文基于linux3.10某一嵌入式系统,该文件系统的配置选项设置如下: 图1.1 根文件系统配置选项设置 两行配置如下: [*] Initial RAMfilesystem and RAM disk (initramfs/initrd) support (usr/rootfs.cpio.gz)Initramfs source file(s) 这两…

JFFS2根文件系统制作

一.根文件系统简介 根文件系统首先是内核启动时所mount的第一个文件系统,内核代码映像文件保存在根文件系统中,系统引导启动程序会在根文件系统挂载之后从中把一些初始化脚本(如inittab、rcS)和服务加载到内存中去运行。 文件系统…

ARM Linux启动流程-根文件系统的加载

前言 在Kernel启动的初始阶段,首先去创建虚拟的根文件系统(rootfs),接下来再去调用do_mount来加载真正的文件系统,并将根文件系统切换到真正的文件系统,也即真实的文件系统。   接下来结核内核代码(内核版本:linux-…

怎么使用 Buildroot 构建根文件系统

1. Buildroot 简介 制作根文件系统有归多种方法: ① 使用Busybox手工制作 Busybox本身包含了很了Linux命令,但是要编译其他程序的话需要手工下载、编译,如果它需要某些依赖库,你还需要手工下载、编译这些依赖库。 如果想做一个极…