生成模型太强大?篡改与伪造检测越来越需要了!这篇最新综述不容错过

article/2025/8/20 14:18:54

关注公众号,发现CV技术之美

最近一段时间,以扩散模型为代表的生成模型越来越能逼真地生成图像和视频,一方面是一群人的狂欢,这是AI的进步,另一方面却是另一群人的担忧,这是AI的危险。

AI技术可以造福人类,当然也可以用来作恶。

社交媒体上的视频造假已经让大家不再坚信“眼见为实”,而金融领域的人脸伪造则成为必须面对的系统性威胁。

e46d9af57482a53629a0fb07436f11f0.png

▲篡改与人脸伪造图像示例

可以看到,经过编辑后的图像整体表现还算比较自然,但仔细放大,还是有一些不和谐的痕迹。

所以面向多媒体数据的篡改(Tampering  ,偏向于多媒体内容的编辑修改)和人脸伪造(Deepfake ,偏向于对多媒体数据中人脸部分的编辑修改)检测技术越来越重要了,成为研究社区不得不讨论的话题。

那么,AI可以打败AI吗?

今天向大家推荐一篇新出的论文『Fighting Malicious Media Data: A Survey on Tampering Detection and Deepfake Detection』,作者参考了377篇文献,系统性综述了篡改与人脸伪造检测领域的相关概念、数据集、技术分类与未来趋势。

6e6094b269fab836f7491f4287b65b4e.png

  • 论文地址:https://arxiv.org/abs/2212.05667

作者来自复旦大学与马里兰大学。

acd6eea83dc11d768057dbd6300c5004.png

▲篡改检测与人脸伪造检测技术示意图

可见,篡改检测(Tampering Detection)要对“整幅图片”进行判断是否经过篡改,如果有的话,以Mask的形式将篡改部分标识出来。

而人脸伪造检测(Deepfake Detection)是对“人脸区域”进行分类,给出是否是经过人为编辑伪造的。

8587ef848bc638bfdb860a207a38646e.png

▲论文总结的相关技术纵览

其中 Genetation(生成) 指篡改与伪造技术,Detection(检测)是指相关检测技术。First/Second/Third Gen指第一代、第二代、第三代数据集。

9f97db7015f281b6472d97e558b7c601.png

▲图像篡改的三种模式

作者列出了篡改检测相关数据集

5cae6fe3fb2401c75c01ee98b6de6e87.png

从统计数据看,年份越近的数据集,数量越大,人工编辑的模式越多。

3fa5bc12b969d38973dae37ee44477dd.png

▲相关数据集展示

作者列出的四种常见的人脸伪造方式:

2595200c37984c18f6d7e9c72bb9ff72.png

▲四种常见的人脸伪造方式

图中(a)为整张脸合成,(b)按特定输入对人脸进行编辑,(c)则为换脸,(d)有参考对象的人脸编辑。

在人脸伪造上,技术越走越远,越来越高清逼真,如下图:

8856038e8f252167e64af28012a6bf20.png

第三代数据集不仅数量大(数量级的提升),而且方法多样。

ba43cf7062cd0b18c911a9cf5c42df1a.png

这是不是也说明造假的人也越来越多,越来越努力了啊?。。。

当然,人脸伪造检测技术也在不断发展,下图为检测的可视化结果:

b5d9a7502c36ed981287397f6500577d.png

在视频领域时空一致也能帮我们判断一部分伪造:

ccac26cd87fec3015017c2eb299ba9f0.png

图中,眼睛一直闭着呢,嘴巴却不停张合。

4d1d086202f682b0d6f720eb1dbfcea6.png

98d28928e1e32f4b8302083bd21d2169.png

最后作者也提到了这一领域面临的挑战与方向

  1. 泛化性挑战,作假技术迭代进步很快,一个模型要对没见过的作假方法有效才行。

  2. 鲁棒性挑战,互联网上的图像视频往往要面对压缩、传输等降质问题,检测模型药足够鲁棒检测出来。

  3. 归属方法不够丰富,不只是真假,类似于是否侵犯知识产权的标签也非常有意义。

  4. 利用多模态信息,RGB信息中可能不太好分辨的造假,在频域可能就比较明显。可解释性。在一些需要进入司法阶段的应用场景,可解释性就非常重要了。

f051a8b98db2ded1ffd6fece54d600b6.jpeg

END

欢迎加入「人脸交流群👇备注:face

778a2c5390d9b51ef9e7e61308c0a947.png


http://chatgpt.dhexx.cn/article/guof5cb0.shtml

相关文章

你越来越孤独的3个原因

昨天看到一句话是这样说的:“交朋友都很难了,还交男朋友。” 我觉得有趣的同时,又发现好像真的是这样,身边好像很久没有出现过新的人了,也很少愿意去参加各种各样的聚会,也没有精力再去认识一些陌生人。 …

超1.58亿人将“血拼”,超级星期六购物节即将到来

超1.58亿人将“血拼”!美国超级星期六购物节即将到来!亚马逊出手整治“远仓近送”! 据美国零售联合会的年度消费者调查结果显示,在今年圣诞节前的最后一个星期六(即超级星期六),将有1.58亿人发生…

复旦女神陈果:孤独是一个人的狂欢,在你寂寞时请关注这些公众号充实自己

复旦大学哲学系博士陈果,对孤独做出了一种完美的诠释。她说:“狂欢是一群人的寂寞,孤独是一个人的狂欢。孤独不求外物,反求诸己。” 在你寂寞之时,请关注这些公众号。他们能给你提供有生命力的阅读,让你在有…

1024 程序员节狂欢盛会,等了一年终于来了!

风起岳麓,扶摇而上,约战湘江,谁与争锋!以“算力新时代开源创未来”为主题的第三届 2022 长沙中国 1024 程序员节于 10 月 22 日-24 日强势来袭!数位院士领衔、中国根技术掌门人以及海外先进开源技术掌门人齐聚&#xf…

夜夜狂欢的派对

奇怪,外国人的语气或思维总因为隔膜的缘故觉得很幽默,是那种“自己不笑却让所有人笑”的幽默。比如早上抛公发给我看的帖子中的几段: “北京有个夜夜狂欢的派对,一定很多人都去参加。因为在北京很多人每天看上去都很疲倦。我不知…

一群搞社区的人

最近Mixlab无界社区参与的电台节目有点多,上次是城市花样精,这次是#社区特辑。推荐给大家: opus 号外号外!好公社“嗲声嗲气”播客和CSDC服务设计社区“月月谈”电台合作啦! 什么?听起来这个合作来得太突然…

一群人的战斗

一、Bug 来了 一个平静的周日午后,正悠闲地在公园里遛娃。突然来了一条消息,打开企业微信仔细看了下,竟大吃一惊:客户成功在群内反馈了 Android A/B Testing SDK 的一个 crash,需要紧急解决。 得知问题后我立刻和客…

一个“后浪”的狂欢,一群中年人的孤单!

点击“技术领导力”关注∆ 每天早上8:30推送 作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) “孤单,是一个人的狂欢,狂欢,是一群人的孤单。” 《叶子》,阿桑,词/曲:陈晓娟 01 …

计算机术语hook的理解

Hooks就像一些外来的钩子,在源代码之间钩取(窃听)一些信息,当它捕捉到自己感兴趣的事发生,就拦截下来,让自己的代码执行一下,处理一下这个信息,然后再放出去继续之前的进程。这样就可…

计算机mips是什么,在计算机术语中,什么叫MIPS

2006-08-18 在计算机术语中,什么叫VGA 显卡所处理的信息最终都要输出到显示器上,显卡的输出接口就是电脑与显示器之间的桥梁,它负责向显示器输出相应的图像信号。CRT显示器因为设计制造上的原因,只能接受模拟信号输入,这就需要显卡…

堆 (计算机术语)

2019独角兽企业重金招聘Python工程师标准>>> 堆(英语:heap)是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。堆总是满足下列性质: 堆中某个节点的值总是不大于或不小于其父节点的值&#xff1b…

计算机术语翻译(Term.)及缩写整理(Abbr.)

Table of Contents 🔮 计算机术语翻译(Term.)及缩写整理(Abbr.)🗡️ DOI, URI, URL, URN🗡️ prompt🗡️ as-is, to-be🗡️ WYSIWYG🗡️ socket🗡…

计算机术语宏是什么意思,宏(计算机术语)

什幺是宏 所谓宏,就是一些命令组织在一起,作为一个单独命令完成一个特定任务。Microsoft Word中对宏定义为:“宏就是能组织到一起作为一独立的命令使用的一系列word命令,它能使日常工作变得更容易”。Word使用宏语言Visual Basic将…

计算机术语中 cam表示,计算机术语中,英文CAT是指_____。

计算机辅助翻译(英语:Computer-assisted Translation或Computer-aided Translation,缩写:CAT)。 亦称计算机辅助翻译系统,透过人工智能搜索及比对技术以及运用参考资料库和翻译记忆程序,纪录翻译人员所完成之译文&…

栈(计算机术语)

1.栈的概念 栈(stack)又名堆栈,作为一种数据结构,是一种只能在一端进行插入和删除操作的特殊线性表。 它是一种运算受限的线性表。其限制是仅允许在表的一端进行插入和删除运算。这一端被称为栈顶,相对地,…

计算机术语翻译在线,常用计算机专业词汇术语翻译

原标题:常用计算机专业词汇术语翻译 ESP: Encapsulating Security Payload,压缩安全有效载荷 Execute Buffers,执行缓冲区 Extended Burst Transactions,增强式突发处理 Extended Stereo(扩展式立体声) FADD(Floationg PointAddition,浮点加) FAT(File AllocationTables,…

台湾 计算机术语,快取,陣列,程式,这些台湾的计算机术语,你知道几个?|冷知识...

原标题:快取,陣列,程式,这些台湾的计算机术语,你知道几个?|冷知识 作者 | 楼下小黑哥 来源 | 程序通事 今天就不写技术文了,写点轻松的,带大家涨点知识。 最近闲来无聊的时候&#x…

计算机术语中bit的中文含义是,在计算机术语中bit的中文含义是

在计算机术语中,bit的中文含义是位。在计算机中的二进制数系统中,位,简记为b,也称为比特,每个0或1就是一个位(bit)。计算机中的CPU位数指的是CPU一次能处理的最大位数。 二进制数系统中,位简记为b,也称为比特,每个二进制数字0或1就是一个位(bit)。位是数据存储的最小单位…

课程设计:基于SQL Server的银行ATM 存取款机系统设计与实现

目录 前言一、项目背景1、项目任务2、项目技能目标3、需求概述4、开发环境5 、问题分析(1) 银行存取款业务介绍(2) 客户信息(3) 银行卡账户信息(4) 银行卡交易信息(5) 银行卡手工账户和存取款单据信息 二、项目实训内容1、实训一:制定《数据库设计与编程规范》2、实…

面向对象的银行ATM系统分析

1.系统概况 1.1目标系统介绍 随着市场经济的活跃,银行电子化建设迅速发展,ATM交易在银行支付渠道中越来越显现出其重要性,以ATM交易为代表的自助交易正逐步成为现代商业银行为客户服务的主流渠道,也就是我们所常说的自动化与无人…