基于噪声伪标签和对抗学习的医学图像分割标注高效学习

article/2025/8/15 4:35:11

目录

背景:

面临问题:

解决方案:

 一   没有图像标注对的学习

二 为训练图像生成伪标签

 2.1 为训练图像生成伪标签

2.2 VAE-Based鉴别器

 2.3 鉴别器引导的发生器信道校准

                        这里有不太理解 (未写完)

三 从嘈杂的伪标签学习

 四   讨论与总结:

五 本次论文学习的问题与不理解之处:


背景:

医学图像分割对于脏器建模、肿瘤准确诊断、定量测量、手术规划等广泛的临床应用具有重要意义。目前,基于卷积神经网络(Convolutional Neural Networks, CNNs)的深度学习在医学图像分割任务上取得了很大的成功,它们的成功在很大程度上依赖于大量训练图像的可用性,以及专家给出的手工注释。

面临问题:

医学图像分割中难以获得大量的人工标注,因为对分割任务进行像素级标注费时且需要具有领域知识的专家来实现。因此,获取高质量的人工标注进行训练成本高、劳动强度大,成为开发用于医学图像分割任务的深度学习模型的主要障碍。

解决方案:

已有的一些解决方案:无监督每周监督基于域适应的方法,但这些方法仍有不足之处,仍需要大量的人工进行标注。

这篇文章从三个方面去尽量解决这个问题

1 一种新的深度学习框架

出了一种新的高效标注的深度学习框架用于医学图像分割,其中模型从一组辅助掩码学习,这些辅助掩码很容易获得,并且与我们的训练图像不配对,因此不需要对每个训练图像进行人工标注。该框架由伪标签生成模块和迭代学习模块组成,前者为每个训练图像获取初始伪分割标签,后者对初始伪标签中的噪声具有鲁棒性

VAE鉴别器与 生成器通道校准(DGCC)模块

了获得高质量的伪标签,我们提出了一种基于vae的鉴别器,鼓励对伪标签进行高水平的形状约束,并提出了一个鉴别器引导的生成器通道校准(DGCC)模块,利用鉴别器的反馈对伪标签生成器的通道信息进行校准。

3   新的迭代噪声鲁棒训练方法

提出了一种新的迭代噪声鲁棒训练方法来学习伪标签,该方法通过基于标签质量的样本选择(LQSS)模块拒绝低质量的伪标签,并提出噪声加权骰子损失来提高最终分割模型的性能。

总体结构示意图:

上图 综述了我们提出的用于医学图像分割的高效标注深度学习方法。a)我们使用一组与训练图像不配对的辅助面具(例如,从胎儿头部分割的形状先验模型中获得)进行训练。(b)改进的CycleGAN从未配对的图像和辅助掩模中学习,获得每个训练图像对应的伪标签,其中提出了基于vaes的鉴别器和DGCC模块,以获得更好的性能。(c)训练集的伪标签。(d)采用噪声鲁棒迭代学习方法,利用伪标签训练最终的分割模型。

下面来分别看看这3个方面:

 一   没有图像标注对的学习

IS分别表示医学图像域和分割掩码域。不同于标准的基于cnn的图像分割方法,需要手动提供来自S的样本,以便它们与来自I的图像配对,我们从I和S的两个未配对集合中得知,它可以有效地从第三方源生成或收集一组辅助掩码,而不是从i中标注训练图像。

首先,考虑到在某些应用中,分割面具具有较强的形状先验(如胎儿头部),我们利用形状模型从分割面具域生成一组随机样本。具体来说,在我们的胎儿头部和视盘分割任务中,分割目标是一个椭圆。该随机生成的样本和形状并不对应于任何真实的训练图像,即我们得到的是未配对的训练图像和随机版。图1(a)显示了我们为胎儿头部生成的随机面具的一些例子。

其次,对于更复杂的难以建模的分割结构(如肺和肝脏),当这种辅助掩模样本可以从其他来源(如公共数据集)获得时,我们可以直接使用一组来自掩模域的样本(与训练图像不配对)进行训练。请注意,一旦从S域获得了一组与训练图像未配对的辅助掩码,下面的训练过程对于这两种情况是相同的。

总结就是:

1. 对于简单的形状我们可以使用形状模型进行生成

2. 对于复杂的模型我们则使用其他的来源,例如(公共数据集)

二 为训练图像生成伪标签

 2.1 为训练图像生成伪标签

对于未与我们的未标注训练图像配对的辅助遮罩,我们通过对抗训练利用它们的高级形状信息来约束生成器Ga,以便Ga为具有与辅助遮罩相同的形状分布的训练图像生成伪标签。如图1(b)所示

 给定I域的医学图像I和S域的辅助掩模S,我们使用伪标签生成器GA将I转换为对应于I的二进制掩码S1= GA(I)(即伪标签),S1由图像生成器GB转换回医学图像Is = GB(S1),相反,GB将S域的辅助掩码样本S转换为S对应的伪医学图像I 1= GB(S),I1被转换回二进制掩码Si = GA(I1)。循环一致性损失,阻止生成器产生与I和Is之间的输入无关的结果(S和Si也一致),计算为:

                          pdata(I)是域I的分布,鼓励S和S1的分配相匹配,

     pdata(S)是域S的分布,DB是一个基于patch的鉴别器,它将输入的每个patch与域S区分为真实                                                       的或假的patch。

对抗损耗是为了克服初始GAN损耗的消失梯度问题而提出的最小二乘对抗损耗,DB用来评估伪标签S的质量。类似地,我们使用另一个鉴别器DA来区分它的输入是真实的还是虚假的医学图像。原始的鉴别器在输出一个单一的标量,只指示输入掩码是真实的还是伪造的作为一个整体,没有给出非局部区域的细节。相比之下,基于patch的鉴别器可以更好地显示生成器输出中子区域的质量。因此,本文采用基于patch的鉴别器来实现DA和DB。

2.2 VAE-Based鉴别器

与常规图像不同,伪分割标签中的像素值不复杂、稀疏,可以通过潜向量将其转换为更紧凑的表示。例如,椭圆型掩模可以通过指定椭圆的大小、位置和方向的低维向量很好地表示。此外,与仅在非常高维的情况下区分原始伪分割标签相比,区分紧致的低维潜向量有可能获得更好的性能。

因此,我们提出利用VAE将二值掩码S和S1分别转换为其潜在向量表示zr和zf。然后,我们应用一个带有三个线性层和泄露ReLU的鉴别器DVAE来区分它们。VAE是一个编码器-解码器网络,其中编码器网络将输入映射为一个低维潜向量,解码器网络尝试重构输入。我们通过强制潜向量服从均值为零、方差为1的高斯分布来正则化编码器。由于V AE的作用是将二维图像空间中的分割掩模转化为一个潜向量的压缩表示,我们使用辅助掩模对V AE进行预训练。在预训练时,以一个辅助掩码作为输入,其解码器将该辅助掩码重构为输出。KL散度损失和L2损失结合Adam优化器进行训练。经过预训练后,我们固定VAE并使用其编码器获得一个输入分割掩码的紧凑表示,并发送到我们的DVAE中。DVAE的对抗损失可以写成:

                 其中Zf、Zr分别是Zf、Zr的集合。pdata(Zf), pdata(Zr)是Zf, Zr的分布

 图 2. 我们的伪标签生成器 GA 的图示,它由鉴别器 DB 通过我们的 DGCC 模块的反馈进行校准。引入了另一个鉴别器 DVA E 来评估在高级紧凑表示中生成的伪标签的质量。

总体损失总结为:

                          其中,λVAE, λadv和λcycle控制三项的相对权重

 2.3 鉴别器引导的发生器信道校准

在标准GAN中,鉴别器通过反向传播的损失函数反馈给发生器,只能用于训练,即间接反馈和隐式反馈。由于基于patch的鉴别器DB可以识别伪标签S的一个patch是真还是假,并且可以学习到典型的表示特征,DB的feature map有可能显式地指导Ga获得更好的结果。此外,由于鉴别器的性能明显优于生成器,因此利用DB的特征图进行校准时,生成器G可以学习得更好、更快。因此,我们提出了一个鉴别器引导的发生器信道校准(DGCC)模块来提高天线的性能,如图1(b)所示,我们使用四个DGCC模块分别在四个尺度上校准天线的特征

在我们的DGCC中,利用鉴别器的反馈导致循环连接。设T为各回路连接的总圈数,如图2所示。在第1轮,发生器GA没有从鉴别器DB反馈。在接下来的几个弯道,我们将DB在t弯道输出层前的嵌入特征图作为我们的反馈信息。

  

                        这里有不太理解 (未写完)

 从嘈杂的伪标签学习

用上述的未配对图像和随机蒙版进行训练后,G A可以用来预测每个训练图像对应的伪分割标签。使用这些伪标签,可以使用一个监督训练管道来训练一个分割模型,比如U-Net[20],使用标准的Dice损失。然而,与标准监督训练的标签不同,我们的伪标签是有噪声的和不准确的。为了解决这个问题,我们提出了一个从GA给出的噪声伪标签学习的两步框架,如图1(d)所示

 首先,我们提出了一种基于标签质量的样本选择(Label quality -based Sample Selection, LQSS)方法,自动拒绝低质量的伪标签,只保留高质量的伪标签;根据GAN一个训练良好的识别器DB可以指示其输入的是来自分割掩码域的真实样本还是假样本,我们基于patch的鉴别器DB的输出是一个N × N的矩阵,其中每个元素表示对应patch的质量。取该矩阵的平均值作为对应伪分割标签Yi的图像级质量分值Ri,具有伪标签的训练集T可以表示为T = {(I1, Y1, R1), (I2, Y2, R2),…(in, yn, rn)}。LQSS后的训练集为:

    

                             其中α是伪标签质量分数的阈值,设为T中Si的75%。

第二步:

在第二步中,从所选图像优质伪标签,我们使用迭代训练过程与K轮,每一轮包括1)更新分割模型通过学习从伪标签和2)预测培训新的伪标签使用当前的图像分割模型,当在验证集上没有提高分割性能时,他将停止轮取。在分割模型更新的步骤中,考虑到伪标签中的一些像素是有噪声的甚至是离群值,这会严重破坏分割模型,我们提出基于估计的噪声水平对每个像素进行加权。由于错误标签的样本容易造成较高的损耗值,我们将较小的权值分配给训练误差较大的像素,以减少潜在的噪声标签的影响。噪声加权骰子损失表示为:

    

 式中= 10−5为数值稳定性的小数值。PI和gi分别为像素I在分割结果和伪标签中的前景概率。权值wi定义为:

   

 四   讨论与总结:

在医学图像分割任务中,大量高质量的人工标注是一项困难且劳动密集型的任务,这是发展深度学习方法的关键障碍。为了缓解这个问题,一些作品已经研究了高效标注的分割方法,但仍需要对训练集进行一些人工标注。虽然之前也有一些通过深度表示学习来研究无监督(即无注释)分割的工作,但它们的分割精度是有限的。本文提出了一种新的框架学习,从一组未配对的训练图像和辅助蒙版,可以很容易地通过形状先验信息或公开可获得的数据集在可能不同的领域。在辅助蒙版的帮助下,我们通过改进的CycleGAN为每个训练图像生成一个伪分割标签,并将伪标签与我们的噪声鲁棒学习过程相结合,得到最终的分割模型。

改进后的CycleGAN可以生成高质量的伪标签,原因如下:首先,辅助口罩是基于形状先验信息或公共数据集,提供目标器官的形状分布。它们被我们的敌对网络用来对伪标签施加形状约束。其次,我们的DGCC模块使用鉴别器的特征图直接校准伪标签生成器,以获得更好的性能。

我们的基于vae的鉴别器的优点是它可以自动学习紧凑的高级形状表示,并且可以很容易地基于辅助遮罩进行训练。VAE的潜向量是对物体形状的隐式建模,有助于约束发生器。尽管所切割器官的形状不同,但其超参数保持一致,即载体长度为32,λVAE值为1.0。结果表明,该方法在所有的分节器官中都是有效的和普遍的。然而,在其他应用中,如处理3D图像或分割船只,这些参数可能需要根据特定的数据集进行调整。可以用带有手动形状约束的编码器来代替VAE。而后者依赖于研究人员的经验,对于复杂的形状很难找到有效的手工约束。

分割模型可以使用我们的ga获得的伪标签进行训练,但是这些标签是有噪声的,并且不是很准确。我们通过噪声鲁棒学习过程克服了这个问题,其中伪标签和最终分割模型是迭代更新的。通过剔除低质量的伪标签,根据Dice loss函数中估计的噪声水平对像素进行加权训练,减轻了噪声标签的影响,从而得到高性能的分割模型。我们的噪声鲁棒学习方法也可以用于存在噪声标签的其他情况,如半监督学习和从非专家标注学习

我们提出的框架可以利用辅助掩码的形状信息分割医学图像,而无需为训练图像添加昂贵的注释。我们的基本假设是,不需要额外的努力,就可以获得一些与目标对象类相关的辅助掩码,而不是与训练图像对应的标注。辅助掩模提供了目标的一些形状信息,并且不与训练集配对。我们展示了这两种可能的方法来获得这样辅助面具:使用参数化形状模型生成一组辅助面具视神经盘等简单的结构和胎儿的头,和利用面具从另一个域的对象(例如,公共数据集)等复杂结构的肺和肝。对于更复杂的结构,如大脑和血管利用来自不同数据集的现有未配对标签进行形状约束可能更具挑战性。我们的方法在这种情况下的有效性将在未来进行调查。本文的方法是在二维网络上实现的,理论上也可以采用其他网络结构,并可以推广到三维图像处理中。

最后,我们提出了一种新的训练框架,利用一组辅助掩码进行医学图像分割。提出了一种改进的CycleGAN算法,用于从未配对的医学图像和辅助面具学习,对抗学习利用辅助面具对生成的训练图像的伪标签引入形状约束。为了提高伪标签发生器的性能,我们引入了基于vae的鉴别器和基于鉴别器引导的发生器信道校准(DGCC)。我们还提出了一种噪声鲁棒的迭代训练方法来从有噪声的伪标签中学习,其中引入了基于标签质量的样本选择(LQSS)模块和噪声加权的骰子损失来克服有噪声的标签。实验结果表明,我们的方法获得了准确的分割结果,与人工标注训练的相同CNN结构接近甚至可以媲美。该框架为避免人工标注训练图像提供了一种可行的解决方案,未来我们将研究其在其他结构分割中的应用。

 

五 本次论文学习的问题与不理解之处

 


 

 

 

 

 


http://chatgpt.dhexx.cn/article/ADmUYaV4.shtml

相关文章

【论文推荐】了解《对抗学习》必看的6篇论文(附打包下载地址)

论文推荐 “SFFAI139期来自美国莱斯大学的傅泳淦推荐的文章主要关注于基础研究的对抗学习领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。” 关注文章公众号 回复"SFFAI139"获取本主题精选论文 01 The Lottery Ticket Hypothes…

对抗机器学习——Universal adversarial perturbations

代码地址: https://github.com/LTS4/universal 核心思想: 本文提出一种 universal对抗扰动,universal是指同一个扰动加入到不同的图片中,能够使图片被分类模型误分类,而不管图片到底是什么。示意图: 形…

【强化学习】模仿学习:生成式对抗模仿学习

★★★ 本文源自AI Studio社区精品项目,【点击此处】查看更多精品内容 >>> 模仿学习– 生成式对抗模仿学习 1. 模仿学习 模仿学习(imitation learning)不是强化学习,而是强化学习的一种替代品。模仿学习与强化学习有相同…

最新综述:图像分类中的对抗机器学习

目录 1.引言 2.论文贡献 3.卷积神经网络简介 4.对抗样本和对抗攻击 4.1.1 对抗扰动范围 4.1.2 对抗扰动的可见性 4.1.3 对抗扰动的测量 4.2 对抗攻击的分类 4.2.1 攻击者的影响力 4.2.2 攻击者的知识 4.2.3 安全入侵 4.2.4 攻击的特异性 4.2.5 攻击方法 5.2 防御…

对抗学习DCGAN网络

文章目录 DCGAN教程1. 简介2. 生成对抗网络(Generative Adversarial Networks)2.1 什么是 GAN2.2 什么是 DCGAN 3. DCGAN实现过程3.1 输入3.2 数据3.3 实现3.3.1 权重初始化3.3.2 生成器3.3.3 判别器3.3.4 损失函数和优化器3.3.4 训练3.3.5 结果 DCGAN教…

NLP中的对抗学习VS对比学习-1

文章目录 1 对抗学习的目的是什么?2 embedding是什么?3 对抗训练4 常见的对抗训练方式4.1 FGM4.2 PGD4.3 FreeAT4.4 FreeLB5 对抗训练和constractive learning6 对比学习的history and achievement思维导图链接:https://www.processon.com/mindmap/64159f9ff502f062b5d616be…

深度学习对抗样本的防御方法

作者: 19届 lz 论文:《深度学习对抗样本的防御方法综述》 问题 2013年 ,Szegedy 等 人 [1]首先通过添加轻微扰动来干扰输入样本,使基于深度神经网络(Deep neural network, DNN)的图片识别系统输出攻击者想…

对抗机器学习模型

重磅推荐专栏: 《Transformers自然语言处理系列教程》 手把手带你深入实践Transformers,轻松构建属于自己的NLP智能应用! 1. Attack ML Model 随着AI时代机器学习模型在实际业务系统中愈发无处不在,模型的安全性也变得日渐重要。…

PyTorch 生成对抗网络 01.生成对抗网络

1. 简介 本教程通过一个例子来对 DCGANs 进行介绍。我们将会训练一个生成对抗网络(GAN)用于在展示了许多真正的名人的图片后产生新的名人。 这里的大部分代码来自pytorch/examples中的 dcgan 实现,本文档将对实现进行进行全面 的介绍&#x…

机器学习中火爆的对抗学习是什么,有哪些应用?

1、什么是对抗学习? 机器学习这一技术自出现之始就以优异的性能应用于各个领域。近年来,随着机器学习的快速发展与广泛应用,这一领域更是得到前所未有的蓬勃发展。 目前, 机器学习在计算机视觉、语音识别、自然语言处理等复杂任务中取得了公…

对抗学习概念、基本思想、方法综述

代码实现篇 对抗学习常见方法代码实现篇 对抗学习的基本概念 要认识对抗训练,首先要了解 “对抗样本”,在论文 Intriguing properties of neural networks 之中有关于对抗样本的阐述。简单来说,它是指对于人类来说 “看起来” 几乎一样&am…

【Python】MySQL数据库(安装MySQL、创建数据库、在Python中使用MySQL数据库)

MySQL是一个小巧的多用户、多线程SQL数据库服务器。MySQ是以客户机/服务器结构来实现的,它由一个服务器守护进程和客户程序组成。在Python中,可以使用pymysql模块连接到数据库,对MySQL数据库进行操作。 本文内容: 一、安装MySQL…

Python结合MySQL数据库编写简单信息管理系统

1,项目整体逻辑及使用工具 1.1 项目整体逻辑 本项目主要是使用Python进行编写,利用Python中的pymysql库进行连接数据库,将信息存入MySQL数据库中,然后实现对信息进行增删改查等一系列操作。 1.2 使用工具 (1&#…

十四、python学习之MySQL数据库(一):安装MySQL数据库

一、数据库概述: 1.数据库概述: 数据库是在数据管理和程序开发过程中,一种非常重要的数据管理软件,通过数据库,可以非常方便的对数据进行管理操作。 2.什么是数据: 数据用来描述事物的特征,…

Python操作MySQL库结(MySQL详细下载、安装、操控及第三方库中的使用)

​ 活动地址:CSDN21天学习挑战赛 学习的最大理由是想摆脱平庸,早一天就多一份人生的精彩;迟一天就多一天平庸的困扰。 学习日记(4) 目录 学习日记(4) 一、下载和安装MySQL 1、下载MySQL 2…

阿里云钉钉应用python后端开发之安装MySQL数据库

阿里云钉钉应用python后端开发之安装mysqlclient 在本系列文章中,项目需要选择MySQL作为默认数据库。 本篇为在Windows上安装mysqlclient。 在python后端开发中,可以选择的数据库有PostgreSQL, MariaDB, MySQL, or Oracle等,一般情况下&…

使用python对mysql数据库进行添加数据的操作

使用python连接mysql进行添加数据的操作 使用的是python3.6pymysql 1、导入pymysql,并创建数据库连接 import pymysql# 使用python连接mysql数据库,并对数据库添加数据的数据的操作 # 创建连接,数据库主机地址 数据库用户名称 密码 数据库…

基于PYTHON语言的工资管理系统制作(一)--MYSQL数据库的下载和安装

去官网下载MySQL Community Server社区免费版,网址如下:MySQL :: Download MySQL Community Serverhttps://dev.mysql.com/downloads/mysql/ 因为我的开发环境是WINDOWS64位操作系统,所以我选了Windows版。 下载完毕后直接傻瓜化无脑全部安装…

Python数据库:MySQL数据库的详细介绍与安装

一、数据库的介绍 数据库(Database)是存储与管理数据的软件系统,就像一个存入数据的物流仓库。每个数据库都有一个或多个不同的API接口用于创建,访问,管理,搜索和复制所保存的数据。我们也可以将数据存储在…

python安装出现modify_Python安装MySQL数据库模块

背景 折腾: 的过程中,需要去安装MySQLdb。 下载MySQLdb 去官网: 看到有1.2.4和1.2.3 所以去最新的1.2.4: 下载对应的编译好的版本: 得到1MB的 MySQL-python-1.2.4.win32-py2.7.exe 安装MySQLdb 双击安装&am…