当包含人脸的视频可以轻易通过电脑生成,我们的生活会产生何种影响呢?基于Deepfake(深伪)科技的应用在近期频频火爆全网。从TikTok上的汤姆克鲁斯向你挥手和大笑,到黑白老照片里动起来的人像神似哈利波特中的魔法部报纸。人们着迷于“深伪”带来的有趣应用,但其的发展带来的潜在危险也引来了许多担忧,FBI甚至对其发出了警告。本文将从Deepfake的技术原理和发展过程,以及社会反响等层面介绍这一技术。
2018年,一条“奥巴马”讲话的视频在网上疯传。视频中,美国国旗前的“奥巴马”正襟危坐,用他带有磁性的声音警告人们不要轻易相信在互联网上看到的东西,随后用令人意外的轻浮词语形容时任总统特朗普是个“百分之百的蠢蛋”。或许是因为“奥巴马”的反差形象造成出奇的娱乐效果,这条视频在媒体和社交平台上得到广泛传播:仅在YouTube平台就有八百多万的观看。
但事实上,整条视频的“拍摄”并没有真正奥巴马的参与,而是演员Jordan Peele在借助计算机技术,凭空制造出来的,是一条典型的Deepfake深伪视频。在让人一笑的同时,这条视频也着实让观众捏了一把冷汗:我们还能相信亲眼所见的东西吗?
Deepfake的技术原理?
Deepfake由deep learning(深度学习)和fake(虚假)两词组合而来,人们通常用Deepfake形容通过使用深度学习等计算机技术合成的照片、视频和音频。其中,有一种Deepfake是算法完全凭空生成的,例如thispersondoesnotexist.com上展示的的人脸图像;而另一种则是基于某些已知信息生成,如上文中的“奥巴马”视频是基于奥巴马过去演讲影像和音频,配合演员的口型与发音而伪造的。Deepfake技术的核心目的是生成虚假的,但是看上去真实的图像或音视频,从而达到欺骗观众眼睛的效果。这个目的其实并不新鲜,亦不陌生:广为大众所熟悉的Photoshop和各种图片视频编辑软件也都是为此设计的。