matting系列论文笔记(三):Boosting Semantic Human Matting with Coarse Annotations

article/2025/9/28 4:36:30

matting系列论文笔记(三):Boosting Semantic Human Matting with Coarse Annotations

论文链接: CVPR2020 Boosting Semantic Human Matting with Coarse Annotations [1]
代码:暂无

文章目录

  • matting系列论文笔记(三):Boosting Semantic Human Matting with Coarse Annotations
    • 前言
    • Abstract
    • 1. Introduction
    • 2. Approach
      • 2.1 Mask Prediction Network
      • 2.2 Quality Unification Network
      • 2.3 Matting Refinement Network
      • 2.4 实现细节
    • 3. Human matting dataset
    • 4. Experiments
    • 5. Conclusion
    • Reference

前言

因为trimap的一些局限性,近来的工作很多都希望不使用trimap,这篇CVPR2020的文章聚焦于Human Matting,同样希望摆脱trimap。文章提出使用前景粗略标注改进matting,达到了接近SOTA的效果。研究人员在主流的语义分割数据集上实验,发现对标注mask的提精明显,相信对AI标注公司来说能大大提高人体像素级标注的效率。

Abstract

trimap的标注是一项劳动密集型工作,且需要较高的技能,尤其是考虑到细致的头发部分。文章提出使用粗标注和精细标注结合来增强端到端语义human matting,不需要trimap作为额外输入。具体的,研究人员训练了三个子网络:

  • mask prediction network(MPN): 使用混合数据估计粗语义mask;
  • quality unification network(QUN): 统一MPN输出的粗语义mask的质量;
  • matting refinement network(MRN): 统一mask和输入图片来预测最终的alpha mask。

研究人员还收集了一些粗糙标注数据集去丰富他们的数据集,为真实图像生成高质量的mask。实验结果显示,文章的方法和SOTA相近。此外,该方法可用于粗标注公共数据集的细化和语义分割,大大降低了标注高质量人类数据的成本。

1. Introduction

主要介绍了什么是matting,以及和语义分割的同与不同。简单讲了下matting问题那个经典的合成公式。接着,文章指出影响matting算法性能的一个关键因素是trimap的精度,介绍了trimap,及其局限性,传统的两种解决方法。

另一个限制是人类matting数据。自然图像中人有各种各样的颜色、姿势、头的位置、衣服、配饰等。围绕前景的语义有意义的结构,如人的头发、皮毛等,对于human matting是挑战性区域。注释如此精确的alpha matte是劳动密集型的,需要比普通用户更高的技能。前人创建了多种数据集,但都有各自的局限性。[2]创建了一个human matting数据集,但仅用于商业用途,而且制作这个数据集花了1200多个小时,实际中不是很可取。所以,文章提出了一种将有限 的精细标注图像和易于采集的粗糙标注图像相结合的解救方案。

为了解决上述问题,文章提出了一种新的框架,利用粗糙和精细的标注数据进行human matting。该方法可以在没有trimap约束的情况下,以高质量的细节和充足的语义信息预测准确的alpha matte。研究人员通过一个拥有三个子网络的耦合pipeline来实现这一目标。

  • mask预测网络(MPN): 主要为了预测低分辨率的包含人类信息的粗糙mask。MPN同时使用精细和粗糙标注数据进行训练,以在各种真实图像上获得更好的性能。MPN的输出有可能不同,所以引入了基于混合标注数据训练的QUN;
  • 质量统一网咯(QUN): 主要为了将MPN输出的质量水平调整到同一水平。
  • matting精炼网络(MRN): 主要用于预测最终精确的alpha matte。输入是原始图像及其统一的粗mask,与MPN和QUN不同的是,matting精细化网络只使用精细标注的数据进行训练。

研究人员还为human matting人物构建了一个混合标注数据集,包含了高质量标注和低质量标注。在该数据集上进行了全面的实验,证明了该文章方法的有效性,其模型能够对粗标注公共数据集和语义分割方法进行细化,进一步验证了方法的泛化性。

该文章的主要贡献:

  • 据他们所知,这是第一种使用粗糙注释数据来增强端到端human matting性能的方法。以往的方法要么以trimap作为约束,要么仅使用足够的精细标注数据集。
  • 文章提出了一种质量统一的网络来矫正训练过程中的mask质量,以便同时使用粗标注和细标注,使语义信息和结构细节更加精确。
  • 该方法可用于细化带有粗标注的公共数据集和语义分割方法,便于从mask(比如DeepLab生成的mask)生成带有细标注的数据。

2. Approach

文章使用了有三个子网络的pipeline。

在这里插入图片描述

2.1 Mask Prediction Network

这个阶段主要为了预测粗糙语义mask,文章使用的是具有skip连接的encoder-decoder结构,同时预测前景mask和背景mask。因为是粗糙的mask,所以不需要很高的分辨率,研究人员将输入分辨率变为了192 x 160,这样效率更高一些。这个子网络训练使用了全部的数据,包括高质量和低质量标注的数据。输出的是两通道的mask。

2.2 Quality Unification Network

主要为了将MPN输出的质量水平调整到同一水平。前一个mask预测网络使用了不同质量的标注数据,必然输出的mask不一样。粗糙mask质量的变化会导致推理阶段的matting结果不一致。如果粗mask相对准确,则精炼网络可以很好的输出准确的alpha mask。相反,如果粗mask缺少重要的细节,细化网路将失败。

引入QUN主要为了消除训练MRN网络中的数据偏差。质量统一网络的目的旨在提高粗mask质量的同时降低精细mask的质量,使得mask预测网络的输出质量达到同一水平。校正后的粗面罩是统一的,并允许一致的输入用于训练后面精确的alpha matte预测阶段。

2.3 Matting Refinement Network

matting精炼网络是为了预测精确的alpha matte。所以训练MRN使用的都是高分辨率的图片。MPN和QUN都是低分辨率的。将粗糙mask集成到MRN中作为外部输入特征图,同时经过多次卷积运算后输入尺度缩小4倍。MRN的输出是4通道的,包括3个前景RGB通道和一个alpha matte通道。预测与alpha matte相结合的前景RGB通道能够增强鲁棒性。

2.4 实现细节

详见paper

TensorFlow框架实现,一些实现和训练细节:参数固定之类的。

3. Human matting dataset

数据集的制作,对其他数据集的分析及其局限性。

4. Experiments

评估指标 SAD,MSE,Gradient,Connectivity

Baselines

文章从语义分割、传统matting方法、用户交互方法和自动方法中选出最经典的方法作为baseline。如下图所示。
在这里插入图片描述
Performance comparison.

如表2所示,文章方法效果接近DIM,优于其他方法,但是DIM需要高质量的trimap。

Self-comparisons.
在这里插入图片描述

Real images

5. Conclusion

文章提出将粗标注数据与细标注数据相结合,以提高端到端语义匹配的性能。我们提出利用混合标注数据集,利用MPN估计粗糙语义mask,然后利用QUN来统一粗糙语义mask的质量。统一mask和输入图像注入MRN来预测最终的alpha matte。收集到的粗糙注释数据集显著丰富了研究人员创建的数据集,并使其能够为真实图像生成高质量的alpha matte。实验结果表明,该方法与现有方法的性能相当。此外,该方法还可用于粗标注公共数据集的细化和语义分割方法,为高质量的人工数据标注提供了一种新的方法。

Reference

[1] Liu J, Yao Y, Hou W, et al. Boosting Semantic Human Matting with Coarse Annotations[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 8563-8572.

[2] Quan Chen, Tiezheng Ge, Yanyu Xu, Zhiqiang Zhang, Xinxin Yang, and Kun Gai. Semantic human matting. In Proceedings of the 26th ACM international conference on Multimedia, pages 618–626. ACM, 2018. 2, 3, 5, 6, 7.


http://chatgpt.dhexx.cn/article/to584q8v.shtml

相关文章

Image Matting 图像抠图技术与深度学习抠图

Image Matting: 图像抠图技术是指从静态图像或者视频序列中抽取感兴趣目标的过程,在ps和视频编辑中有重要的应用。 1.Image Matting Matting 技术可以表示为下面的图,与语义分割不同,它可以针对感兴趣前景物体进行细节处理、包括细微的毛发和…

论文阅读——Deep Image Matting

一、摘要 强调image matting(抠图)的现实意义。已有的算法在前景和背景颜色相似或者拥有复杂的纹理时表现较差,主要原因有两个,一个是只运用到低维特征,另一个是缺少高维语境。所以这篇论文提出了深度模型算法可以解决…

【CVPR2022】Boosting Robustness of Image Matting with Context Assembling and Strong Data Augmentation

Boosting Robustness of Image Matting with Context Assembling and Strong Data Augmentation 中文题目 利用上下文组合和强数据增强的增强鲁棒图像抠图 paper:https://openaccess.thecvf.com/content/CVPR2022/papers/Dai_Boosting_Robustness_of_Image_Mattin…

图像抠图Image Matting算法调研

目录 1.Trimap和Strokes 2. 相关数据集 3.论文算法调研 3.1 Deep Image Matting 3.2 Semantic Image Matting 3.3 Background Matting 3.4 Background Matting V2 3.5 Semantic Human Matting 3.6 HAttMatting 3.7 MMNet:Towards Real-Time Automatic Por…

抠图技术及方法简介(Image Matting Overview)

之前接触过语义分割,所以在刚接触图像抠图时以为两者是差不多。语义分割是端到端的,对像素按照语义进行多分类,而抠图就是按照前景和背景进行二分类嘛?实际上这是错误的理解。语义分割重在对每个像素的语义理解,将相同…

Portrait Matting

文章作者为 Google Research 的软件工程师 Sergio Orts Escolano 和 Jana Ehman,文章发表于 2022 年 1 月 24 日。 Portrait Matting 网络 抠图是提取精确的 alpha 遮罩的过程,抠图假设图像是前景和背景图像的合成,因此每个像素的强度是前景…

Background Matting详解

转自:https://zhuanlan.zhihu.com/p/148265115?from_voters_pagetruehttps://www.aiuai.cn/aifarm1462.html 使用人工智能技术实现类似PhotoShop等工具的抠图功能是一个非常有趣且有科研前景的一个方向。和分割算法只有 和 两个值相比,抠图得到的边缘…

【Matting】MODNet:实时人像抠图模型-onnx python部署

上一篇博客【Matting】MODNet:实时人像抠图模型-笔记分析了MODNet的原理,本篇博客将使用python部署MODNet官方提供的onnx模型,其效果如下: 在线人像抠图体验:CV案例 相关部署链接: 【Matting】MODNet&…

【笔记】Robust High-Resolution Video Matting with Temporal Guidance

Robust High-Resolution Video Matting with Temporal Guidance算法笔记 一、算法简介二、网络结构三、训练1、数据集2、训练过程3、损失函数 Robust High-Resolution Video Matting with Temporal Guidance 论文地址 RobustVideoMatting 代码地址 Robust High-Resolution Vide…

【Matting】MODNet:实时人像抠图模型-笔记

paper:MODNet: Real-Time Trimap-Free Portrait Matting via Objective Decomposition (AAAI 2022) github:https://github.com/ZHKKKe/MODNet 抠图在线体验:CV案例 部署教程: 【Matting】MODNet:实时人像抠图模型…

Image Matting 客观评价指标、数据集及主观评价

Image Matting 客观评价指标、数据集及主观评价 2021.7更新 PPM-100数据集已经开放,GitHub,详情见下文章节2.4 目录 Image Matting 客观评价指标、数据集及主观评价2021.7更新 客观评价指标1. 精度1.1 SAD1.2 MSE 均方误差1.3 Gradient error1.4 Conne…

深度学习(7)之图像抠图 Image Matting算法调研

目录 1.Trimap和Strokes 2. 相关数据集 3.论文算法调研 3.1 Deep Image Matting 3.2 Semantic Image Matting 3.3 Background Matting 3.4 Background Matting V2 3.5 Semantic Human Matting 3.6 HAttMatting 3.7 MMNet:Towards Real-Time Automatic Portrait Matt…

【SHM】Semantic Human Matting抠图算法调试

前言: 2018年阿里的论文《Semantatic Human Matting》给出了抠图领域的一个新方法,可惜阿里并没有公布源码,而牛人在Github上对这个论文进行了复现,我也是依赖Github上的工程进行钻研,而在调试的过程中,发…

[Matting]论文阅读:Deep Image Matting 详细解读

[Matting]论文阅读:Deep Image Matting 详细解读 一 、摘要 任务二、方法2.1 第一部分(Matting encoder-decoder stage)2.2 第二部分(Matting refinement stage)2.3 数据部分(Composed Datasets&#xff09…

【CVPR2022】MatteFormer: Transformer-Based Image Matting via Prior-Tokens

MatteFormer: Transformer-Based Image Matting via Prior-Tokens 中文题目: 借助先验Token的基于Transformer的图像抠图 paper:https://arxiv.org/pdf/2203.15662v1.pdf code:https://github.com/webtoon/matteformer 摘要 本文提出了一个基于Tran…

Image Matting代码和算法效果总结

本文参考了:http://blog.leanote.com/post/610167078qq.com/Image-Matting。作者给出了大部分matting-code的链接,说明也比较细致、系统,在这里向作者表示由衷地感谢!以下是博客的原文: 肖总博客:http://3…

matting笔记_一周小结

去年刚入坑的旧笔记,刚翻出来… 1. 利用神经网络做抠图的入坑之作《Deep Image Matting》 详情见之前的笔记 matting系列论文笔记(一):Deep Image Matting 由于image matting的工作没有特别好的综述,有的综述也不是…

Matting 基于DeepLearning 入门

前言 是比较清晰的用思维导图的形式介绍了一些Matting 基于DeepLearning 的经典论文,如 Deep Image matting可以通过这篇初步了解深度学习Matting领域该篇论文可以看作是基于深度学习研究Matting的开山之作,之后的许多有效、可行度高的做法都是基于这篇…

Matting和Segmentation区别及模型概述

一、两者区别 Segmentation:常被认为是硬分割(Hard Segmentation),就是将图片中的像素分成多个类别,如果是前背景分割,那么就是分成两个类别,一个类别代表前景,一个类别代表背景。而…

如何清除Safari,Chrome和Firefox中的缓存,历史记录和Cookie

如何清除浏览器的cookie缓存?许多网站的通知,用户记住账号密码登录状态,都是通过浏览器cookie缓存,定期清理Safari,Chrome和Firefox中的缓存,历史记录和Cookie,可以让浏览器保持一个良好的状态,也可以保护我们的隐私。…