数据资产的玄学、显学
数据就是资产,这个道理在商业领域并不难懂。
比如国外有聚焦金融数据的彭博,国内也有万德,早期靠着人工录入、整理数据的方式,聚集了庞大的数据库,成为投资公司的必备;而聚焦学术文献等知识数据的知网,不仅舒舒服服赚差价,还能涉嫌垄断被处罚。
但数据资产这个理念,在全社会得到认可,也非一蹴而就,而是一波一波的普及、深化。
2011年,麦肯锡发布报告,认为“大数据Big Data已成为当今竞争、创新、生产效率提升的关键基础”。一时间,大数据,成为业内热点。数据,大家都懂;大,有什么区别?
聚焦大数据的创业公司纷纷成立,时任美国总统的奥巴马也在2012年3月宣布了“大数据研究与发展先导计划”,虽然投资额仅2亿美元,但有评论认为这和上世纪90年代的信息公路计划相媲美。
而不管大的是什么,至少一个确定的趋势是,数据资产,越来越值钱。
这股科技新风也来到中国。本着“懂不懂先不说,有新趋势就先干”的大A,也渐渐热闹起来。比如拥有消费者购买记录的百货公司,虽然还处于电商取代线下的衰退趋势中,但投资者还是兴奋地给了“估值重构”的机会,2013年7月份,也曾有过股价快速涨一倍的战绩。
而最“得势”的当属银之杰,公司通过收购亿美软通,为企业向用户发送短信,每年发送量超过100亿条。每一条短信,在投资人眼里,都是金灿灿的“数据资产”。再叠加科技牛市buff,银之杰受到投资者的狂热追捧。从2012年底起,两年半涨幅近100倍。一个字,绝。两个字,疯狂。
2015年4月,我国首家大数据交易所——贵阳大数据交易所成立,对数据资产的探索,又迈出了关键一步。成立当天就完成了第一笔数据交易,交易所管理层也雄心勃勃,提出在3~5年内将日交易额推到100亿元的规模。
蜂拥而至的故事,结局似乎都差不多。2016年,Gartner在报告中警告:许多公司正打算削减大数据项目投入。
百货行业没有避开电商的冲击,业绩也没有被数据资产改善;而短信等数据,也让投资人清醒,有的数据是资产,有的只是01代码,或者只是投资人情绪的载体。而在大数据领域创业的公司,也有一些融了FGH轮之后,不得不卖服务器来改善现金流。而贵阳大数据中心也在2022年8月,才实现了数据交易规模突破1亿元。
然而,也正如Gartner公司经典的科技发展曲线一样,技术发展不是一帆风顺,数据的资产重塑,也必经历曲折。基于庞大数据的算法,正成为许多公司业务提升的诀窍,例如在短视频、在自动驾驶。而数据交易所的数量扩展到了30多家。
数据资产,似乎是“玄学的显学”,显而易见的是,数据很重要、数据很好用、数据很值钱;而玄之又玄的是,数据如何成为资产?如何成为可交易的资产?如何成为产生更大收益的资产?要回答这些问题,并不容易。
苹果“关门”:数据属于谁
2020年,苹果公司内部发生了一场激烈争论,话题是“是否限制对iPhone用户广告追踪”。负责技术开发的一方,希望加大对用户隐私的保护;而负责广告、营销业务的一方则认为,开发人员需要通过广告来盈利,这个限制会引起合作伙伴的反对。
最终,2021年4月,苹果推出了折中方案,应用开发者必须事先询问用户,是否同意在线活动被其他网站和应用跟踪。
虽然是折中方案,但对于广告主们而言,仍然是“晴天霹雳”。毕竟,这个提问,就等同于问“把你家打开让陌生人进去怎么样”。用户显然基本上不会同意。
用户的拒绝,就是广告主的损失。比如有研究认为,Facebook、Twitter等几家公司,就因为苹果新方案而在2021年下半年损失了近100亿美元广告收入。而与之对应,2021年11月苹果公司财报显示,广告业务,创下季度新高。
广告公司指责苹果这个做法带来“破坏性”,甚至“别有动机”。但却丝毫没有办法,毕竟,用户的数据都在手机上。
苹果和广告主的“冲突”,并不是个例。国内手机商华为也和应用开发商腾讯,关于数据有过争议。华为智慧助手可以根据微信聊天内容来提供个性化内容服务,比如提供差旅信息,就有天气、车票等推荐;聊到看电影,就有电影、买票渠道等推荐。而腾讯则认为这个做法侵权了腾讯的数据、用户的隐私。
类似的纠纷还有顺丰和菜鸟、微博和今日头条等等。在公司激烈争吵之外,产生数据的用户,似乎是真正的所有者,通常情况下只能默默无声。而这些状况,都指向了数据资产的核心问题:确权。
用户的数据所有权、平台的数据所有权,如何界定?
不当访问:该用数据做什么
一个不成文的行业惯例,是用户的数据属于用户;但提供服务的平台,可以通过用户的授权(不点击同意授权,就没办法使用应用),对数据具有一定的使用权。通过对数据的分析、使用,提升整体效率、拿到双赢自然是最好不过了。
一个经典的案例,是沃尔玛通过样本数据得到结论,在尿不湿旁边摆放啤酒,既提升了销量,又节省了用户选购时间。而在地图软件上,通过分析终端用户的数量、用户的移动速度,也可以对路况得到大致的分析,有助于用户提前规划路线、节省时间。
数据分析提升生活的案例,不胜枚举。但不可否认的是,算法的世界,也有信息茧房、大数据杀熟等等让人担忧的事情。数据的使用,也有边界。
最近,某互联网公司的国际业务犯了个错误,员工未经用户允许、且在非法律要求的情况下,查看了几位用户的数据。尽管几位员工的目的和探寻公司机密信息泄露相关,但很不幸,这个行为依然引起了舆论的轩然大波,同时也会面临监管机构的调查、甚至处罚。
我们目前的数据,大部分都是和个人相关,要变成资产,就必须先守好边界。用户期待的是,用我的数据,让我更好;而不是利用我的数据,找到我的弱点,猛攻、谋利。
隐私计算:安全分析数据
汽车领域有过一场争论,关于整车厂是否要丢掉自己的灵魂。
这个冲突在现实中很常见,拥有数据的公司,许多并不具备分析数据的能力,而如果把数据完全公开给合作方,不仅涉及隐私、甚至还会丢掉灵魂。而另一方面,一家机构的数据维度有限,要达到更好的效果,也难免会涉及多方数据共享。
如何让数据合规、安全得到处理?所谓,原始数据不出域、数据可用不可见。这就需要用到“隐私计算”。
隐私计算,也是前几年的创业热潮。刚需性毋庸置疑,但在从概念验证走向商业落地过程中,存在的瓶颈也是显而易见:技术路线差异大、派系众多、理论复杂晦涩。比如在技术体系方面,就有:
姚期智教授在1982年提出的“多方安全计算”;可追溯到1996年的、谷歌也在大力使用的“联邦学习”;Intel等芯片公司推动的由软硬件方法构建安全区域的“可信执行环境”;以及包括差分隐私、图联邦等在内的其他技术等。
而所有的技术路线,也都有一些共性瓶颈。专注于隐私计算领域的上海富数科技,在和远川科技的产业交流中强调,本身用来解决安全合规问题的隐私计算,却也存在多个“安全黑盒”:
算法协议存在“安全黑盒”。虽然隐私计算的理论基础是公开、被广泛认可的学术研究成果,但在实际应用中,为了满足商业环境需求,也会自行改造算法协议,而这部分修改对客户是不透明的,也缺少严谨性,但却存在安全基础坍塌的风险。
这就有点类似于祖传秘方,也许好用,但也不知道为什么,总还是有点担忧。
算法代码存在“安全黑盒”。算法代码容易被恶意修改,无法与算法协议保持一致性,从而也破坏了算法原本的安全性和正确性。
数据交互存在“安全黑盒”。原始数据一般会先经过本地计算和加密处理,产生中间数据,然后再用中间数据和合作方进行交互。但,中间数据的准确性无法验证。这不禁令人想到一幕幕鬼才的翻译桥段,中间人如果不靠谱,做啥都是干瞪眼。
应用流程存在“安全黑盒”。单个算法可能满足安全要求,但是多个算法流程的组合,是否安全,就存在不确定性。这也好理解,概率论告诉过我们,多个非100%的准确率叠加后,同时都正确的概率就会大幅降低;而且,组合也会提高复杂度。
隐私计算的审计监管存在“安全黑盒”。隐私计算产品中的算法、数据安全性和一致性难以验证评估,因此审计监管只能依赖人工审查和理论证明。而如果采用“自证清白”的方式,不仅流程繁复、效率低下,而且静态的验证也难以检测真实应用情况。
困难重重。但解决方案也在推进,比如通过数据洞察、通信透析、日志开箱、代码审计、全链路可视化等方式,可以有效缓解黑盒瓶颈。
隐私计算的应用,会逐步打破数据孤岛,将数据资产连接起来,实现真正的数字社会;但隐私计算的发展,也并不是安全公司一家的事儿,对算力、通信网络传输性能都提出了巨大需求和挑战。
黑客勒索:数据资产如何估值
前段时间,蔚来公司遭遇到了黑客勒索,要求支付225万美元等额比特币(约合1570.5万元人民币)以换取盗窃的数据不泄露。遭到蔚来拒绝后,黑客进行了公开定价出售,比如2.28万条内部员工数据值0.15比特币、39.9万条车主ID数据值0.25比特币等等。
虽然黑客对数据进行了明码标价,但实际上,对数据资产,进行估值定价并不是一件容易的事。
目前海外国内都未对数据资产价值评估形成体系化的框架理论。上海数据交易所和普华永道联合发布的《数据要素视角下的数据资产化研究报告》中显示,处在研究中的方法包括:成本途径、收益途径、市场途径。
成本途径,即以年均历史开发成本、持续运营成本为基础,结合数据有效使用年限、使用率、质量等要素,计算出数据资产价值。这个方式的前提要求有历史成本可计量。
收益途径,即以新的使用场景产生的年均增量收益为基础来评估。这个方式的前提要求具备买方场景的效用评价体系。
市场途径,即市场说了算,愿意支付多少就是多少。而这个方式的前提是,具备良好的流通市场。也就是,得有活跃市场、才能定价。这就有点像套娃,好的流通需要有好的定价体系,而有效的市场定价,则需要好的流通市场。
在农业中,有一句话,资产千万,带毛不算。这是说牲畜容易因传染病而遭到巨大损失,不容易估值。而数据资产的估值,且先不说数据真伪判断,单说评估难度,也不亚于“带毛的”。但估值,又是数据成为资产,必不可缺的一环。
也许可以借鉴的,是股票市场,从90年代开始,关于新股定价多番探索。而数据资产,作为更加非标准化的产品,摸索路径难免也会更加曲折。
尾声
每个时代,都有其对应的核心资产要素。
农业经济时代,农业技术是第一生产力,土地、劳动力、农耕工具是核心生产要素;工业经济时代,蒸汽、电力技术是第一生产力,能源、设备、资本,也成为核心要素。
而在当下数字经济时代,数字技术成为第一生产力,数据资产,也已经和土地、劳动力、资本、技术等并列成为生产要素。
数据不仅只有个人数据,企业数据、公共数据,都是可以挖掘的资产。数据资产的时代趋势是清晰,但路径却充满挑战:搜集、确权、加工、分析、定价、使用、监管,多个环节、多种困难。正视困难,是成功的开始。
而时代机遇,也恰恰存在于解决时代难题的过程中。
注:本文“隐私计算”部分,得到上海富数科技的产业指导。富数科技成立于2016年,是隐私计算互联互通首个国家标准的牵头单位,也是上海数据交易所的首批全球签约数商。
本文来自微信公众号“远川科技评论”(ID:kechuangych),作者:董指导,36氪经授权发布。