深度造假和对现实的战争

随着深度造假的出现，将真实与虚构区分开来变得更加困难. 深度造假几乎有可能破坏他们的目标——2020年的政治竞选, 本地或国际新闻和时事, 甚至是某人的离婚诉讼. 几乎所有的新闻机构, 社交媒体平台, 一家从事视频工作的科技公司正在探索如何检测和抵消深度造假, 但当我们开始研究这篇文章时, 我们发现很少有人想谈论它.

“如果技术可以创造一些东西, 技术应该能够检测出它是真实的视频还是被编辑过的,彼得·彼得卡说, 首席技术主任 RadioMobile 前首席技术官 Verimatrix, 他专注于反盗版和法医视频安全.

“深度造假取的是你的真实形象, 当你发出不同的声音时，你的嘴唇应该如何移动, 然后人为地, 比如CGI图形, 使你的嘴唇动起来，使它听起来像你说了什么,彼得卡说。. “音频也是如此. 如果有人分析你的声音, 然后他们就能合成你说过的带有你语调的东西, 你的口音, 还有其他的."

这是一个新兴领域, 但基本上，彼得卡之前从事的内容安全业务也有非常类似的问题需要解决. “了解一些视频捕捉、编辑和压缩技术, 我想一定有办法检测出来."

深度造假的传播令人不安

据报道，深度造假主要是用来把著名女艺人的脸放在色情作品上。深度造假的状态.这是Deeptrace进行的一项研究, 一家从事检测和监控的科技公司合成视频.

“我们的研究显示，深度造假现象在网上迅速增长, 深度假视频的数量在过去7个月里几乎翻了一番，达到14个,678," 写了乔治·帕特里尼，Deeptrace创始人、首席执行官兼首席科学家，2019年9月.

“这一增长得益于工具和服务的日益商品化，这些工具和服务降低了非专业人员制作深度伪造的门槛.该公司的研究发现了多个论坛, 开源代码, 应用程序, 以及深度伪造内容创作平台. 根据报告, 一项服务需要250张图片和两天的处理才能制作出逼真的深度假照片.

Deeptrace在网上发现的deepfake视频中，高达96%是色情视频, 排名前四的网站获得了超过1.34亿的浏览量. 剩下4%的深度造假视频是在YouTube上发现的，从政客到企业人物都有. 当前许多深度造假的质量, 包括内容被篡改成南希·佩洛西(Nancy Pelosi)的形象, 唐纳德·特朗普, 巴拉克·奥巴马(尤其是在由 BuzzFeed 如本文开头图片所示), 马克·扎克伯格和其他人, 穷到有人说他们是“廉价货”吗.“担忧, 虽然, 是不是技术进步如此之快，以至于很快就很难区分深度假货和真货了.

那不是真的猫，也不是真的人

“deepfake”这个词来自“深度学习”和“假”.“人工智能领域, 与创建深度伪造相关, 根植于一类被称为生成对抗网络(GAN)的机器学习。, 神经网络通过从训练集中获取数据并生成新内容来相互竞争.

“这一切都是关于人工神经网络捕捉实际实体并学习表征，甚至学习数据的风格表征并编码这些信息的能力,博士说。. Mika Rautiainen，芬兰公司首席执行官/首席技术官 Valossa实验室. “这些信息(被用来创建)生成模型，基本上可以创建新内容."

Valossa开发了图像识别软件来识别人, 对象, 以及视频内容中的情绪，并提取这些元数据来描述正在发生的事情或用于重点提取. “深度造假已经成为该公司的副业, 我们正在研究开发它的技术和方法,劳蒂宁说.

开发新内容, 无论是图像, video, 或音频, 机器学习需要训练数据. 为了了解猫长什么样, 必须向系统展示足够多的猫，以便系统学习猫的所有排列-猫躺着, 睡觉, 战斗, 坐着, 站, 还有一些不是猫的东西. 制造一个现有的人做一些他们没有做过或说过的话，或者创造一个合成的人, 系统需要数据来学习. 早期的努力不是很现实(从左图可以看出).

Thispersondoesnotexist.com 是一个模拟人的档案，由王菲力建造. 该网站展示了假人的高分辨率照片，浏览量已超过5000万次. “我们已经找到了一种方法，让计算机解开数据集, 理解它背后的所有模式, 然后能够重建并生成与训练数据没有区别的新数据. 在这种情况下，它是脸，但它可以是任何东西. 你可以绘制建筑图或植入牙齿。”王说.

“高分辨率非常重要. 数据质量越好, 这种特定架构的输出就越好，(因为)他们有更多的东西要做.“Thispersondoesnotexist.com在使用70的8个gpu上进行了一周的训练,000张高分辨率图片来自Flickr的开源数据集. “(视频)还没有达到像图像那样令人震惊的地步，”王说. “由于计算的限制, 也可以穿越时间, 这意味着每一帧都需要保持一致性."

“我认为解决假图像问题可能是解决重大视频问题的一个代表. 视频只是图像帧的集合，所以它属于同一研究领域，”王说. “我认为，如果你对每一帧都进行取证, 你肯定可以找到不同的线索来判断它是否被修改过."

这个人不存在

这是一个名为“这个人不存在”的网站上数百张人工智能生成的深度假图像之一.

获取训练数据

打击深度造假的第一步是确定什么是Deepfake，什么不是Deepfake. “该行业没有一个很好的数据集或基准来检测(深度造假)。,Mike Schroepfer说, Facebook首席技术官, 在一个博客. “我们希望在这一领域促进更多的研究和开发，并确保有更好的开源工具来检测深度伪造. 这就是为什么Facebook, 人工智能伙伴关系, 微软, 以及康奈尔理工学院的学者, 麻省理工学院, 牛津大学, 加州大学伯克利分校, 马里兰大学, 学院公园, 和纽约州立大学奥尔巴尼分校合作建造 Deepfake检测挑战 (DFDC)."

参与者将竞相创造新的方法来发现和防止被操纵的媒体. Facebook为此提供了超过1000万美元的资金，并聘请了付费演员, 而不是Facebook的用户数据. 亚马逊也加入了DFDC，并捐赠了AWS信用额度和技术支持. Facebook生成的新数据集包含数万个示例视频, 真假兼备. 竞争对手将利用这些数据集设计新的算法，以检测真实或虚假的视频。” 写了米歇尔·李，AWS机器学习解决方案实验室副总裁.

“他们利用演员制作深度造假视频, 因此，研究团体可以尝试找到在像素级粒度上剖析媒体的方法, 使用不同的方式和方法来解码或预测媒体的真假,劳蒂宁说.

问题是，使用actor是否会创建一个足够好的数据集? 一家名为dessaus的加拿大公司引用了谷歌使用付费演员制作的合成视频. 《百家乐软件》 报道使用参考数据的失败率为40%. 当Dessa从其他现实场景中挑选其他训练内容时, 它能够提高成功率.

我们能确定的是什么?

为了发现一些东西，了解它们的共同特征是必不可少的. 今天的深度伪造的特点是“在运动中有不连续性或音频和视觉不同步的轻微迹象”. 在面部和头部运动之间可能存在不连接的区域, 色彩或光照差异(背景和前景之间的平均光照颜色),劳蒂宁说. “通过仔细分析语音音轨, 您可以映射信息，并尝试在视频中找到相关性或去相关性."

一个问题是，侦测器和操纵器都在寻找同样的东西. 如果检测工具在寻找人们微笑时眼角的鱼尾纹, 我们知道deepfake的创造者也在考虑同样的事情. “没有人提出一个通用的标准, 扫描仪, 检查所有不同的技术…就像我们今天认为的病毒检测一样,朱焯信说, 首席产品官 Brightcove.

一种潜在的检测方法类似于今天用于内容保护的方法. “如果我给视频加水印或者加数字签名, 任何想要修改视频的人要么会破坏签名要么会破坏水印, 它会给我一些提示，让我知道这个视频有问题,彼得卡说。.

下一个页面