数据是新石油?Benedict Evans:没有数据这回事

机器之能
+ 关注
2022-06-02 12:39
402次阅读
我们被告知,数据是新的石油。每个国家都需要数据战略,我们所有人都应该拥有自己的数据,并为此付出代价。但这种表述不仅含混而且意义不大。牛津大学社会人类学教授项飚曾谈到,很多人都说「数据是新的石油」,他对这个说法一直不太明白,因为数据它当然是大型平台公司、网络公司的基础,但数据本身是不是直接产生效益呢? 人的关联性是不是比数据更重要?这一质疑在著名分析师 Benedict Evans 的最新博客中得到了一定程度的回应。他在文中指出,没有数据这回事,它也不是你的,脱离流动的体系和上下文,数据分文不值。

作者 | Benedict Evans

技术充满了叙事,但其中最响亮的是关于「数据」的。人工智能是未来,一切都与数据有关,数据就是未来,我们应该拥有它,也许还应该为此付出代价,国家需要数据战略和数据主权。数据是新的石油!
这基本上是无稽之谈。不存在所谓的「数据」,它没有任何价值,而且它也不真正属于你。

最明显的是,「数据」不是一件东西,而是无数不同信息的集合,每一个都针对特定应用程序且不可互换。西门子有风力涡轮机遥测系统,伦敦运输公司有刷卡售票系统,你不能用涡轮遥测技术来规划新的公交路线。把这两组数据都给谷歌或腾讯,也不会帮助他们建立一个更好的图像识别系统。

直截了当地说,这似乎微不足道,但它指出了一些断言的无用性,尤其是科技外行人的断言,比如「中国有更多的数据」或「美国将有更多的数据」——更多的什么数据?美团每天送出 5000 万份餐厅订单,这让它可以构建更高效的路径算法,但不能用于导弹制导系统。在伦敦,甚至无法用它来打造餐厅外卖。

「数据」并非某个一体化的存在,你可以往一个巨大池子里不断添加各种表格以获取更多洞见。制定「国家数据战略」的提法就像要求制定「国家电子表格战略」或「国家数据库战略」一样(奇怪)。

当然,当人们谈论「数据」时,他们主要指的是你的数据——你的个人信息和在互联网上做的事情,其中一些被科技公司筛选、聚合和部署。我们想要更多的隐私控制,也认为应该拥有这些数据的所有权,无论它们在哪里。

问题是,大多数「你的」数据的意义和价值并不在你自己身上,而在与他人的交集中。你在 Instagram 发的东西没多大意义:真正有用的信号在于谁喜欢你的帖子、这些人喜欢什么、你喜欢其中多少、谁也喜欢这些;谁关注你、他们还关注谁、谁又关注他们?等向外构建起来的十亿人的交互网络。我喜欢你的照片,那不仅仅是「我的」数据或「你的」数据的问题,没有点赞和关注你的人,它就没多大价值。这些数据你也带不走,因为这里头也有许多别人的数据(还有隐私!),即使你这么做了,你也可能无法把它接入 TikTok,因为 TikTok 又是另一张交互网络,和 Instagram 用户少有重叠。

也就是说,许多类似这样系统的价值并不在于「数据」本身,而是围绕数据的活动流。——意义不在于你上传的图片或视频,而在于网络如何反应,如何打造产品并捕捉到这些网络反应。你可以将 Instagram, TikTok 或 PageRank 视为一种巨型土耳其机器人( Mechanical Turk,一种众包网络集市,能使计算机程序员调用人类智能来执行目前计算机尚不足以胜任的任务——译者注),毕竟我们还没有可以看懂每一个网页、图片和视频的 AI,还需要人类——社交网络节点上的所有人——来做这些事情,比如点赞、观看、点击等。这些涉及的是系统,不是数据,价值诞生在系统的流动中。

这也是为什么 Tim O'Reilly(O'Reilly Media 出版公司创始人,Web 2.0 概念的首创者——译者注)说「数据不是石油,而是沙子」,只有在数百万的数据总和中才有价值。事实上,即使在简单的现金流基础上,这也是真的——2022 年第一季度,就每一位月活用户来说,Meta 每月仅为其创造了 99 美分的自由现金流。

这也适用于所谓的「个人」数据,你可以有意义地说它是「你的」。你的用电量与他人无关,但它本身没有价值,只有在伦敦南部或布鲁克林的所有家庭用电量的总和中(它)才有价值。DeepMind 的研究人员或许能从100 万张胸片中发现一些新的、具有临床重要性的相关性——但你的胸片本身并没有给他们带来任何东西,他们也没有把这些片子输入 AlphaGo。再说一次,这和数据不是一回事。

我们以前也遇到过这种情况。今天关于人工智能和数据的讨论很像上世纪80年代关于数据库的讨论。当时,我们变革了使用信息的方式,问问题的方式以及组织运作方式。数据库还是新事物时,我们也曾担心,有些担心是真的,但今天没有人会问美国是否有更多的数据库,或者 SAP 是德国的是否重要。达沃斯也没人谈论「数据库殖民主义」。这些技术不是国家战略资产——任何人都可以拥有——关键是用来做什么?数据库支持即时生产(just-in-time)供应链和沃尔玛,让苹果在中国生产 iphone——这些是战略问题。人工智能和「数据」也是如此——它不是新的石油,只是更多软件,所以(关键是)你用它来构建什么?
参考链接
https://www.ben-evans.com/benedictevans/2022/5/27/theres-no-such-thing-as-data

本文来自微信公众号 “机器之能”(ID:almosthuman2017),作者:Benedict Evans,36氪经授权发布。

原标题《没有数据这回事》

0
相关文章
最新文章
查看更多
关注 36氪企服点评 公众号
打开微信扫一扫
为您推送企服点评最新内容
消息通知
咨询入驻
商务合作