CVPR2020:上交大让合成图像更真实,提出了通过域验证进行深度图像协调(开源)

article/2025/9/18 12:04:28

 

作者

介绍

图像合成是图像处理中常用的操作。我们可以从一个图像中剪切并粘贴前景,然后将其粘贴到另一个图像上以获得合成图像。合成地图可以用来获取感兴趣的目标图像,也可以用于数据增强。它有着广泛的应用。然而,用这种方法得到的合成图存在着前景大小或位置不合理、前景与背景看起来不一致等问题。我们的工作重点是解决合成图像中前景与背景不协调的问题。具体来说,在合成图像中,前景和背景是在不同的拍摄条件(如时间、季节、光线和天气)下拍摄的,因此在亮度和颜色方面存在明显的不匹配问题。图像协调的目的是调整合成图像中的前景,使之与背景相协调。

 

传统的图像协调方法通常将背景或其它图像的颜色信息传递到前景,但这不能保证调整后的前景看起来真实,与背景和谐。近年来,人们尝试用深度学习来协调图像,但合成图像和真实图像的配对非常困难。如果没有成对的合成图和真实图,那么深度学习的训练过程就缺乏足够强的监控信息,合成图协调后的结果也不是评价的基本事实。截至目前,还没有公开的大规模图像协调数据库。我们已经构建并发布了一个由四个子数据库组成的图像协调数据库。此外,提出了域验证的概念,并尝试了一种基于域验证的图像协调算法。

 

方法

 

我们构建数据库的方法是按照策略建模的。具体来说,在给定一幅真实图像的情况下,我们选择一个前景来调整它与背景的不一致性,得到一幅人工合成的图像。这种建立数据库的方法可以生成大规模的训练数据对,以训练深度学习模型。但之前的paper没有公布其建立的数据库,而且建立数据库的方式在合成地图的合理性和多样性上存在明显的缺陷。调整前景使其与背景不协调并不困难。仅仅改变前景的亮度就可以快速生成大量的合成地图。然而,很难保证合成图的合理性和多样性,也很难接近实际的应用场景。

 

因此,我们在之前文献中建立了一个扩充版和增强版的数据库,其中包含73146对合成图和实图。我们的数据库包含四个子数据库:HCOCO、HAdobe5k、hflicker、Hday2night,其中Hday2night是在之前文献中找不到的子数据库。Hday2night的合成图更接近真实的合成图,与其他3个子库相比具有特殊的参考价值。针对合成图像生成中存在的各种问题,我们采用了两轮自动筛选和人工筛选的方法,逐一保证最终保留图像的质量。对最终数据库进行了全面详细的分析,包括不同的前景比例、不同的前景调整方法、不同的语义类型对图像协调数据库的影响以及图像协调算法的结果。接下来,我们从每个子数据库中选择两个示例来显示我们的数据库。如下图所示,我们调整真实图像的前景(对应于遮罩的区域)以获得合成合成图像。可以看出,在合成图像中,虽然前景是真实的,但它与背景明显矛盾,整个图像看起来不真实。图像协调的任务是调整合成图像的前景,使其与背景相协调。

 

Domain是一个非常宽泛的概念,在不同的应用任务中有着不同的含义。与域相关的应用也吸引了越来越多的研究者的兴趣,如域自适应、域泛化、域分类、域翻译等。

 

近年来,许多流行的图像到图像的翻译方法如pix2pix、cycleGAN、MUNIT、DRIT等都属于域翻译的范畴。域转换的一个经典应用是将白天的景观图转换为夜间的景观图,白天和夜晚可以被看作两个域。同样,我们把每个拍摄条件(如时间、季节、光线和天气)视为一个域,因此对于真实的图片有无限多的可能域。真实图像的前景和背景是在相同的拍摄条件下拍摄的,因此属于同一个域。合成图像的前景和背景可以在不同的拍摄条件下拍摄,因此属于不同的域。我们不知道合成图像中前景和背景的域标签,只需要将前景转移到与背景相同的域。因此,图像协调可以看作是特殊场景下的域转换。在此基础上,提出了域验证的概念,即确定前景和背景是否属于同一个域,并设计了一个域验证鉴别器,用来拉近前景和背景的和谐度。区域。我们的整体网络结构如下所示:

作者生成器的结构是基于UNet实现的,但是添加了一个类注意块。而且还引入了两个鉴别器。

  • 第一鉴别器是在生成对抗网络(GAN)中作用于整个图片的标准鉴别器,使得生成图片的数据分布接近真实图片的数据分布。

  • 第二个鉴别器是我们提出的域验证鉴别器,它使生成的图像中的前景域和背景域尽可能接近。

 

具体来说,我们首先使用部分卷积分别提取前景和背景的域表示。部分卷积首先应用于图像修复。该方法用于提取形状不规则的前景和背景的域表示,避免了其他区域信息的泄漏和默认填充方法的干扰。基于前景和背景的域表示,作者提出了一种域验证损失。虽然域验证损失最终以对抗性损失的形式包装,但它本质上是基于前景域和背景域表示的相似性的验证损失。在建立的数据库上,作者的方法、传统的图像协调方法和基于深度学习的图像协调方法进行比较。实验结果表明,该方法优于现有方法。可视化结果的比较如下图所示。作者比较了先前的图像协调深度学习方法DIH和S2AM,而且作者也比较了没有域验证鉴别器的方法。

此外,作者还对之前文献提供的99幅真实合成图进行了用户研究,结果表明作者的方法优于现有的方法。对于量化指标,由于有一幅真实的地面真实图,可以对生成地图的效果进行量化评价。

 

作者使用MSE和PSNR,并提出了只考虑前景的fMSE,因为对于前景比例较小的合成地图,转换后的前景误差可能会被背景重建误差所覆盖,尝试过其他定量指标,如SSIM、LPIPS等,但由于合成图和实图在结构和语义上非常接近,所以作者认为这些定量指标并不十分可靠。因此,最终只使用定量指标MSE/fMSE、PSNR和用户主观评价指标B-T得分。

 

论文地址:

https://arxiv.org/pdf/1911.13239.pdf

源码地址:

https://github.com/bcmi/Image_Harmonization_Datasets

 

更多论文地址源码地址:关注“图像算法”微信公众号


http://chatgpt.dhexx.cn/article/SthxerH3.shtml

相关文章

【合成图片】——Graphics2D

背景 在之前的文章当中我们已经说过【二维码】——生成解析,可是现实中需要将二维码合成到海报的指定位置中,这样来扩展我们的产品销售渠道,基于这样的一种需求我们就需要将之前的二维码合成到另外一张海报图片中,所以接下来说一…

Qt图像合成原理

Qt图像合成原理 本文为原创文章,转载请注明出处,或注明转载自“黄邦勇帅(原名:黄勇) 本文出自本人原创著作《Qt5.10 GUI完全参考手册》网盘地址: https://pan.baidu.com/s/1iqagt4SEC8PUYx6t3ku39Q 《C语法详解》网盘地址&#…

PHP图片与文字合成

public function coupon_image($coupon){$userName $coupon[username];//合成的文字$path public_path();//这里我的查找路径方法,你用你自己的即可ob_clean();$types array(1 > "gif", 2 > "jpeg", 3 > "png");//图片类…

PS素材合成照片

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、最终效果图二、过程1.素材2.工作面板 总结 前言 利用素材合成照片 工作环境:Photoshop2022、win10 一、最终效果图 二、过程 1.素材 图 图 …

JAVA (Graphics2D)解决合成图片失真问题

附对比图: 合成后失真严重 代码优化后: 原代码: 参数解释: 1. img为你需要把他合成到A图片上的B图片,以下简称为章 2. srcImagePath为A图片的绝对路径 3. targetPath为合成后的图片输出路径 4. x,y为章需要合成到…

Java实现图片合成

功能 竖向合成多张大小不一致的图片,以最宽图片的为宽为合成后的宽度, 高为所有图片的总高度.图片宽度没有达到合成的宽度则填充部分使用白色画布填充. 代码 /*** 多张图片进行竖向合并成一张图片* param imageFiles 图片文件* param dstPath 合成图片路径* param hasLine 是…

html5 图片合成,H5案例分享:图片合成

图片合成 图片合成是h5案例中常用的展现方式,成功案例也有很多,譬如: 今天,小五就一个小demo来和大家磨叨磨叨图片合成的具体实现方法。 一、界面样式: 二、所用技术: easeljs + interact.js,easeljs是方便对canvas进行操作,interact.js主要是用来调整图片的位置大小的…

Python照片合成

文章目录 前言Github效果实现过程整体代码 前言 看电影的时候发现一个照片墙的功能,觉得这样生成照片挺好玩的,于是就动手用Python做了一下,觉得用来作照片纪念的效果可能会不错。 P:后面了解到我想做的功能叫蒙太奇拼图,所以这…

Python:合成图片

简介:PIL库中Image库封装了很多对图片处理的函数,支持对图片进行合成等操作。 相关攻略: python: ocr简单示例 - 识别验证码 python:彩色照转黑白照 python:个性签名 Python:利用cv2模块对图片进行灰度…

如何编辑图片合成图片?让我们来看看这些合成方法

相信大家在日常出行的时候,都会遇到想要和自己的朋友合照这种情况,却会因为社恐而不敢去向他人求助或者不想麻烦他人。所以通常我们会在同一个场景中拍摄照片,然后通过后期编辑将这些图片组合在一起,那么有的朋友会问,…

信息流产品和内容推荐算法

(一)什么是信息流产品 当下,信息流(资讯)和短视频是唯一两个在用户领域保持好的增长事态的细分行业。像其他比较成熟的互联网细分行业,比如说移动社交,电商,OTO这个细分行业&#x…

O2O商城系统,适合本地电商发展的商城系统!

说起商城系统,最适合本地电商发展的要数O2O商城系统了,O2O商城系统有什么优势? 一、本地O2O商城系统对商家的好处 1、本地O2O商城系统对消费人群定位比较明确,针对性强,而且本地的人消费习惯都比较了解。这样也容易形成固定的…

[转]从本地电子商务中走出来,6个很好的O2O模式解析

谓O2O就是线上到线下(Online to Offline) 请看以下几个非常好的O2O模式: Uber Uber是一个允许你通过手机购买一个私家车搭乘服务的应用。其运作方式如下:下载Uber应用,发出打车请求;几分钟内一辆私家车来到…

Oauth2协议

Oauth2协议 Oauth2简介角色常用术语令牌类型特点 授权模式授权码模式(Authorization Code)简化授权模式(Implicit)密码模式(Resource Owner PasswordCredentials)客户端模式(Client Credentials…

2021年中国医药O2O行业发展现状、发展问题及发展建议分析[图]

医药O2O模式指的是基于线下药店,利用现存资源,将门店的功能从售药转变为体验、提货和配送,贴合当地需求,完成和用户的最终接轨。 随着疫情防控成为常态化,医药电商与数字医疗也迎来了新的发展。医药的网上销售呈现出逐…

中国IT运维O2O市场发展研究及十四五前景规划分析报告2022-2027年

中国IT运维O2O市场发展研究及十四五前景规划分析报告2022-2027年 第1章:IT运维O2O的概念界定与内涵1.1 IT运维的概念界定与内涵 1.1.1 IT运维的概念 1.1.2 IT运维的演化历程 1.1.3 IT运维的内容 1.1.4 IT运维的流程 1.1.5 IT运维的价值 1.2 IT运维O2O的概念界定与内涵…

案例直播 | Pulsar Summit Asia 2022:Day 1 - 分论坛 1:腾讯、华为、有道、vivo、科大讯飞...

关于 Pulsar Summit Pulsar Summit 是 Apache Pulsar 社区年度盛会,它将分布在世界各地的 Apache Pulsar 项目 Contributor、Committer 和各企业 CTO/CIO、开发者、架构师、数据科学家,以及消息和流计算社区的精英召集在一起。于此盛会,大家分…

高德导航免费,那他靠什么收入?

来源 |一口Linux 一位工作了12年的软件工程师说:当你打开导航时,不需要任何费用,还会给高德公司带来丰厚的收入。当时我不信,去查了相关资料后,才知道这个行业不简单。 出门外出,对路线不熟时&a…

全球及中国前置汽车中冷器行业需求趋势分析及发展规划研究报告2021-2027年版

全球及中国前置汽车中冷器行业需求趋势分析及发展规划研究报告2021-2027年版 2020年,全球前置汽车中冷器市场规模达到了XX百万美元,预计2027年可以达到XX百万美元,年复合增长率(CAGR)为XX% (2021-2027)。中国市场规模增长快速,预计将由2020年的XX百万美元增长到2027年的X…

智能家居市场应采用精准营销策划模式

智能家居在全世界的发展都属于新鲜事物,在中国市场,智能家居行业参与进来的企业众多,包括跨国企业也包括本土的强势品牌都参与其中,唐太子、霍尼韦尔、莫顿、新加坡NICO、上海索博、广东安居宝、波创科技、海尔集团、天津瑞朗、联…