编者按:这是一个人人都可以发布新闻的时代,但是这也导致了假新闻、假视频、假内容的泛滥。这些虚假信息的恶果早已显现,甚至可能影响了历史进程。如何才能解决这个问题?社交媒体管理系统Hootsuite CEO Ryan Holmes在一篇文章中探讨了各种内容验证的机制,并且认为这有可能催生下一波的数字化浪潮。
你大概看过那个假视频了吧——那个奥巴马称特朗普为“彻头彻尾的大笨蛋”的假视频。声音做得不是完全像,但是这个剪辑——这个花了BuzzFeed的视频专业人士56个小时创作出来的东西——却生动地说明了deepfake(换脸工具,几乎可以让任何人说任何东西)等的威胁已经开始萌芽。
Deepfake技术已经被用来将名人的脸植入到色情电影里面,认识到它对政治的潜在危险并不难。将假声明嫁接到国家行为者口中很容易就会引发一场国际争端,股市恐慌,或者甚至一场彻底的战争。这种威胁绝非科幻小说,实际上,它距离我们是如此之近以至于美国国防部负责新兴军事技术的DARPA都已经组建了一个官方媒体取证实验室来寻找假冒内容。
当然了,掺假视频并不是假新闻前线的唯一威胁。2016年的美国总统大选就提供了一个有说服力的例子,说明了普通老套的假新闻头条,在社交媒体的发酵下,就能够影响世界事件的进程。从此以后,我们对事后审查已经变得习以为常,偶尔也会对在我们的新闻流上传播的可疑故事信以为真。(真正的新闻跟一些政治家的假新闻掺杂在一起是没有帮助的)到头来,我们只会对谁和什么值得信任变得十分不确定——如果说还有信任的话。
社交媒体坐在许多挑战的火山口上。这里是大家现在获取新闻的主要场所,令人悲哀的是,也是最容易被人操纵的地方之一。作为一个在社交媒体上建立起职业生涯的人,我发现这一点令人担忧。我对社会渠道建立联系和打开对话的威力有很大的信心。像Facebook和Twitter这样的网络已经成为互联网管道设施的一部分,是不会消失的。但是虚假内容——不仅仅是古怪、容易被摒弃阴谋论,也包括能够让专家也忍不住多看两眼的令人信服地视频,这些内容的传播已经成为越来越大的威胁。
在这种气候下如何才能恢复对在线内容的信任和信心呢?在我看来,前面的道路不仅是算法调整或者新的一套监管。这个挑战的复杂性是这些手段处理不了的。从根本上来说,我们是在讨论对我们在网上看到和听见的东西的信心问题,关于信任让个人、公司以及整个国家做出知情决定的裸数据的问题。贴创可贴式的修补方案的适用时间早就过去了。相反,我们也许是在讨论数字化时代的下一个增长行业:内容验证。
生机盎然的内容验证业
有趣的是,随着造假者与侦探之间猫捉老鼠游戏的加速,我们已经看到这个领域出现了一股骚动。尤其是Deepfake现象已经刺激了一波技术反击的热潮,最近已经被Axios的Kaveh Waddell概括过了。刚刚吸引到了路透社等1000万美元投资的初创企业Truepic,已经把目光放在寻找类似眼睛反射率和头发位置之类的细节,这些在视频成千上万帧图像里面想要作假几乎是不可能的。Gif托管平台Gfycat则利用了AI工具来检查身份异常,并且将令人不快的视频剪辑撤出网站。
在学术和研究领域,洛斯阿拉莫斯的卡学家正在开发算法搜寻重复的可视化元素,这是视频操纵的指示器,而纽约州立大学SUNY Albany分校的研究人员已经开发出了一套系统,该系统可以监控视频眨眼的吗模式。与此同时,DARPA及其媒体取证团队也在寻找AI生成的脸部的光线情况不一致的地方。
不过更令人棘手的是,标记那些假的和带偏见的文本型新闻故事——那种内容很容易制作流入到社交媒体里面也很容易。这里不需要什么技术花招,只需要一种古老的能力,编出令人信服地谎言,利用语言操纵读者自身的偏见和情绪。也许出于这种原因,这些假故事似乎避开了机器检测,往往需要直接的人为干预才能弄清楚。
在Cambridge Analytica 事件以及2016年美国总统选举危机之后,Facebook尽管技术娴熟,也得求助于跟一支越来越庞大的人类事实查验师队伍合作来审查平台上的内容。由用户(或者机器学习)标记为假的文章会被转发到Facebook在全球14个国家的25家事实查验合作伙伴那里,包括Associated Press、PolitiFact以及Snopes等。反过来,被视为假的内容会被Facebook降级处理,也就是放到新闻流中较后面的位置,这会导致未来的浏览量下降超过80%。
这种人工的、零敲碎打式的办法显然还有许多待改进的地方:不同的事实核查组织的标准各不相同,甚至明显假冒的故事在Facebook有机会将其降级之前可能已经流行起来。此外,规模的对比也令人沮丧:根据一项估计,k上面每60秒钟就有510000条评论发布,有136000张照片上传。毫无疑问,不会有足够的事实核查者来审核所有假新闻的报告。
信任的未来
解决这个问题有没有更好的办法呢?必须有。办法简单吗?不会。这里就需要独创性和市场机会形成合力了。比方说,我们能不能找到一种办法利用域名权重(搜索引擎排名分,可充当“信任度”的粗略代理)来审查在社交媒体上分享的内容?(比方说,像《纽约时报》这样的渠道其域名权重为99/100,这样的网站可以排名为高度可信。)这种办法伸缩性强,但是,必须承认的是,远谈不上完美,因为域名权重基本上是基于回链(linkback)而不是事实正确性。
或者我们能不能从HTTP协议那里找到线索?浏览器地址栏旁边的可靠的加锁符号提供了即时保障,说明我们正在浏览的这个网站(比如银行或网店)是安全的,我们的敏感数据是安全的。不难想象这个概念在内容世界里面会是多么的有用:我构思的是给被验证为真且实时准确而不是假冒的视频、照片和故事加盖一枚精美的勋章。挑战是HTTPS不过是加密的保证罢了。确保数据准确性是一个棘手的问题,而且从技术和人的角度来看也要复杂得多。
那区块链呢?将不可篡改的总账存在云端,对所有内容追根溯源,这想法听起来绝对很有吸引力。用户可以比较视频或者图像的版本,看看是不是修改了,而水印可以充当质量的印记。(的确,这个基本上是Truepic app背后的思路。)不过在这里,问题依然是这个办法能否应用到文本型的内容上,因为其欺骗意图留下的技术痕迹很少。
所以,综合内容验证想象起来要比实现容易得多。曾几何时,我们有过一个相当好的体系来解决这个问题——它的名字叫做新闻业。尽管存在种种限制和瑕疵,但新闻渠道对特定准确率标准的渴求,专业人士倾其一生去捍卫它的表现,这些都很好地应对了问题。互联网和社交媒体已经侵蚀了传统编辑看门人的角色。现在任何人都可以发新闻了。任何人都可以传播虚假信息。任何都可以进行诽谤。而随着复杂的新闻工具的扩散,几乎任何人都可以创建一个令人信服地虚假现实。
但是我依然乐观。数字经济(这个东西日益只有经济而已)的骨干是信息交换。当这一信息失去了可验证性时,将会产生巨大问题……以及巨大的商机。内容验证是一个有待填补的真空,说不定还代表着下一波数字化浪潮之一。
原文链接:https://www.fastcompany.com/90236068/is-content-validation-the-next-growth-industry
编译组出品。编辑:郝鹏程。