当社会经济活动数字化转型按下发展加速键,数据愈发成为不可忽视的生产要素。最大化释放数据的核心价值及流通性,加快数据资产化进程,成为把握时代风口、抢占行业先机的关键因子。
然而,数据资产化的道路并非顺风顺水,存在着数据安全与个人隐私问题突出、数据开放与流通困难等痛点。针对于此,在政策法规层面,国家陆续出台《网络安全法》、《数据安全法》等法规,对数据可交易的范围作了明确边界。
在安全技术措施上,以安全多方计算、联邦学习、可信执行环境为三大领域代表的隐私计算技术逐步走入社会、行业市场的视野,以能实现数据“可用不可见”,被视作实现数据要素安全流通的可靠解决方案。
从2020年Gartner将隐私计算纳入2021年最前沿的九大趋势之一,行业迎来爆发性元年,从业者数量如雨后春笋般得到快速发展,到2021年行业逐步探索隐私计算的商业化落地,这一过程中有哪些值得关注的地方?隐私计算技术的商业模式又该怎么做?这些成为了行业热议的话题。
借此话题,在2021年世界人工智能大会上,朋湖网专访了由中国最大的信用管理集团“中诚信”投资孵化的以安全多方计算、联邦学习、区块链为核心技术的数据智能科技服务商——洞见科技联合创始人、CTO何浩先生,望通过与他的采访一揭隐私计算行业的面纱。
数据流通、应用的前提是合法合规,“究竟隐私计算中哪些相关技术能够满足数据的合法合规流通?”何浩告诉朋湖网,“行业初期的标准化建设是非常关键的一步。”
据了解,“隐私计算”这一概念最早出现在2016年发布的《隐私计算研究范畴及发展趋势》中,其定义为:“面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。”
简单而言,其本质就是在保护数据隐私安全的前提下解决数据的流通、应用等难题。发展至今,隐私计算采用的主流技术包括三类:安全多方计算(MPC)、联邦学习(FL)和可信执行环境(TEE)。
针对技术的标准化,现阶段北京金融科技产业联盟、中国信通院等标准制定机构正协同行业多方加快推动隐私计算技术标准研制、开展关键技术研究,洞见科技亦积极参与其中,协同制定安全多方计算、联邦学习、隐私计算+区块链等的标准规范,圈定哪些技术能够支撑数据要素的基础设施建设。
何浩表示,“在监管机制层面上做好标准的制定,让技术底座更牢靠,能够避免行业的野蛮生长,也能让企业少走许多弯路。”
在技术标准的规范下,目前,隐私计算行业发展已经走过第一阶段,即平台、技术框架等已经完成了从0到1的搭建,下一阶段需要行业在算法的深度与广度继续推进扩展,一起推动技术的商业化落地。
在商业化落地的场景中,金融与政务领域是当前的强需求行业,也是洞见科技主要发力的领域。基于此,洞见科技独立自主研发并推出了一款金融级的隐私保护计算平台产品——INSIGHTONE(洞见数智联邦平台)。
其以安全多方计算(同态加密、差分隐私、不经意传输、混淆电路、秘密共享等)、联邦学习和区块链技术为核心,构建了“数据资源引擎+隐私计算引擎+信用科技引擎+区块链网关”的“三横一纵”技术架构,具有“高安全、高性能、高兼容”三大优势特性:一是推出无第三方联邦学习(NTP-FL)技术,解决多方联合建模中的第三方可信风险问题;二是推出快速联邦学习技术,算法有数十倍的速度提升,解决联合建模中的性能问题;三是通过“MPC+FL” 的双计算引擎,适配不同计算场景,并在一定标准内支持异构计算框架之间的互联互通。
INSIGHTONE平台能够通过匿踪查询、集合运算、联合统计与智能建模等应用服务矩阵的构建,为金融、政务等业务场景的数据安全流通赋能,实现“数据可用不可见”。
此外,洞见科技亦落地了省市级的政务数据能力开放平台等案例,助力政府将政务数据开放给金融客户,扮演着数据流通的“桥梁”作用。
在讲到商业化落地的路径时,何浩表示,目前有两种商业模式,一种是以标准的隐私计算平台去提供产品的服务,简单而言就是软件平台的销售思路,售卖平台以及底层的算法插件,客户可以在上面构建自己的业务系统;另外一种是打包数据能力提供给客户,为其设计一个完整的解决方案,这更偏向于定制化,而能否为客户提供一个从数据到业务系统的端到端的解决方案也是下一阶段跑马圈地的关键点。
目前,洞见科技两条路径都在尝试,何浩解释道,“没有一个核心平台,解决方案也没有办法落地,有解决方案提供给客户后得到的反馈需求亦对平台的标准化迭代具有积极作用。当客户数量越来越多时,产品的标准化程度也会越高。因此,洞见科技标准化平台与解决方案能力都在做。”
隐私计算行业中的客户更看重什么?
行业中竞争因素是什么?
何浩认为,客户看重的因素有两点:其一是如何证明安全性,因为目前隐私行业还处于市场教育阶段,还需要培育客户在这方面的意识,需要用各种方式去证明,如在算法的原理上去证明其不能反推出原始的数据等。
其二是做具体场景落地,而场景落地应用效果的决定因素在于“算法”与“数据”。何浩讲道,“在数据的流通应用中,真正跑的是算法,给客户提供服务和决策的还是算法。”另一方面,隐私计算的“算法”本质上改变了数据的流通方式,但是“数据”本身的质量才决定着最后的使用价值。
当然,“算法”与“数据”缺一不可,没有高质量的数据集,算法模型再好也没有用,没有最优的算法参数,数据价值亦没有办法挖掘出来。
未来,当技术、平台的成熟度发展到一个阶段,进入同质化竞争局面之际,行业的增长点便在于是否能对数据有正确的认知以及如何能将它用得更好。
我们知道,隐私计算的出现是为了解决数据的流通与隐私保护的矛盾,它解决了当前普遍存在的“数据孤岛”问题,实现了“数据可用不可见”、“数据不动价值动”。
这是隐私计算发展的第一步。
但不同的隐私计算厂商采用的技术路线都大不相同,即使技术路线相同,细分、优化的架构涉及的点都不一样,隐私计算是基于数据之上作数据价值的抽取,那么当不同厂商都用自身协议构建其数据互通生态及合作伙伴之时,不可避免地将陷入另外一座孤岛——“计算孤岛”。
何浩表示,通用性是许多客户的需求,平台的互联互通会影响其使用的便捷性。那么,未来,平台之间的互联互通将成为隐私计算发展过程中实现价值释放、创造与效率提升的关键点。
于是,第二步便是打破行业“计算孤岛”。
为此,北京金融科技产业联盟、中国信通院等机构正在积极开展互联互通系列标准的制定工作,信标委、信安标委等国家标准制定机构也均启动了隐私计算互联互通的相关研究。“对于洞见科技而言,一方面洞见科技正在积极参与国家标准制定机构的相关标准制定工作,另一方面亦与友商在客户场景落地中实现了互联互通。”在今年6月,洞见科技与蚂蚁集团、锘崴科技首次实现了多方异构隐私计算平台的算法协议的完全对等网络互通。
未来,洞见科技会致力于和更多的友商去做生态的开放,助力行业发展进入平台互联、生态互通2.0时代。
在数据如同空气与水的数字化时代,隐私计算将作为重要力量推动着数据资产化的实现。 而洞见科技愿做这一力量的推动者,最大化“算法”力量与“数据”价值,打破“数据”、“计算”两座孤岛。
文章来自:朋湖网,已取得授权