首页 >热门资讯> 数据分析 > 香港理工大学电子计算学系系主任、IEEE Fellow曹建农:用区块链辅助数据共享需重视四大挑战 | 链上数博 >

香港理工大学电子计算学系系主任、IEEE Fellow曹建农:用区块链辅助数据共享需重视四大挑战 | 链上数博

转载时间:2022.01.21(原文发布时间:2019.05.28)
114
转载作者:36氪企服点评小编
阅读次数:114次

编者按:本文来自36氪战略合作区块链媒体“Odaily星球日报”(公众号ID:o-daily,APP下载)香港理工大学电子计算学系系主任、IEEE Fellow曹建农:用区块链辅助数据共享需重视四大挑战 | 链上数博

5月27日,由2019中国国际大数据产业博览会组委会主办、中央广播电视总台央视财经频道联合主办、中国信息通信研究院承办、泰尔英福协办、Odaily星球日报独家媒体报道的“区块链板块高端对话——数字文明的基石”在贵阳盛大开幕。

《失控》作者凯文.凯利、比特大陆联合创始人吴忌寒等区块链顶尖专家学者,围绕区块链推动可信数字社会发展的主题,探索“区块链+”的生态构建等内容发表演讲、开展巅峰对话。

上午,香港理工大学电子计算学系系主任、IEEE Fellow曹建农发表了有关于如何使用区块链辅助数据共享的主题演讲分享。

他认为如果想用区块链做数据方案,存在4个问题,分别是如何让用户控制数据灵活共享;如何使用不同方法查找数据;如何减少延迟以及如何解决公平性。除以上4个问题外,还存在如何保障匿名性等问题。

以下为经Odaily星球日报编辑整理后的曹建农致辞全文:

各位大家早上好,我是来自香港大学的曹建农。过去的研究都是围绕着互联网和移动计算,近几年学校又成立了大数据分析研究中心,研究的范围从传统的分布式研究和移动无线网络扩展到现在大数据分析以及云计算、边缘计算和区块链技术。

首先讲一下为什么要做大数据交换,为什么区块链作为大数据交换技术支持是一项很有用的解决方案,最后讲一下未来研发的方向。

大家都知道现在大数据很热,包括贵阳大数据博览会也进行了四届了,从大会刚刚兴起时,大家谈到的都是应用,但是有很多挑战。

第一,大数据是多元的,而且是来自于不同领域的。要解决一个现象时要用到很多不同领域的数据集,这些不是从单一一个资源方可以得到。这就牵涉到一个问题,怎么“共享”我们的数据。

其中最大挑战就是如何共享数据。什么情况下有共享数据的需求?首先,各地政府和底层的初创公司都强烈需要数据能够共享。开放数据为什么这么多年推不下去?很重要的原因是因为没有数据支持,数据无法共享的其中一个原因就是缺乏信任,比如你用了我的数据,会不会误用?会不会篡改后,在数据没有授权的情况下给别人使用?公开数据现在是一个运动,但是这个运动推广不下去,因为数据共享技术方案没有得到很好的解决。

第二,需要互相合作。比如智慧家居,现在有很多做智慧家居的公司。你买了电冰箱、洗衣机、电视机,都是来自不同智慧家居服务商,他们的数据不互相公开,你怎么形成智慧家居的统一方案?

第三,大数据交易。数据是一个资产,我的数据给你用时,也不是无限给你用。贵阳很多年前就有大数据交易平台落地,交易平台里面的数据共享也存在着信任的问题,如怎样定价等问题。这也是数据共享的其中一个应用场景。

应对不同的需求,现在在国内和世界上都有很多大数据共享平台。虽然有各种各样的大数据分享平台,但可归纳成几种方式。

第一,数据托管。有数据供应方把数据上传到托管中心,由不同的代理查询这些数据,得到这些数据后进行使用。数据的托管中心还是一个中心化的,需要大家把数据上传到托管的平台上。

第二,数据聚合平台。不需要把原始数据和大量数据上传到平台上,但是你把数据的原数据信息上传,形成文件的索引,供大家查询。他们私下进行交换和共享时,通过点对点方式来传输。

它们有各种不同的好处和坏处。

数据托管的权威性更强,大多数数据托管中心都是经过政府和一些可信任的机构认证或者授权的。数据聚合平台适用性相更强,但它让用户上传原数据,所以它的可信性相对降低了一些。

我们需要寻找解决方案,它需要既有权威性,又能保证私隐和安全。区块链就提供了一个很好的解决方案。

区块链是分布式的账本和分布式的中心库,它可以去中心化,有数据不可篡改,透明化的特性。

首先去中心化可以保证私隐性,当数据共享上来时,你甚至不知道是谁共享的数据,你只能看到这个数据。第二,透明性和不可篡改保证权威性,大家互相信任。

我们在区块链方案的设计上有三个原则。第一,应用无关;第二,安全可靠;第三,灵活的控制数据共享内容。

第一:有很多数据平台应用,这个平台最好跟具体数据应用无关,这样就需要我们有一个通用性的表达方法;

第二:必须安全和可靠。这需要去中心化,有共识,不可篡改,要保证分布式的账本;

第三:保证数据共享的内容和数据共享的方式,有各种不同的控制方式让大家享用这个数据。

表面上看着很简单,实际上有很多挑战性,我讲四方面的挑战。

  1. 怎么让用户控制数据灵活共享;

  2. 不同方法查找数据;

  3. 如何减少延迟;

  4. 怎么解决公平性。

这里我只讲了四重挑战,可能后面还有更多的挑战,比如如何保障匿名性等问题。我们实验室在从各种不同的层次上做了多种研究。从最底层的数据打包,到最新的脱敏性,以及做非对称的数字编码和签名、共识层的新共识算法等。

我们现在有三个项目,第一个跟华为共享的项目,第二是跟阿里巴巴做了供应链数据管理的项目,第三现在在做的刚刚拿到香港政府支持的,食物安全方向的供应链区块链应用研究方法。


36氪企服点评

数据分析相关的软件

大厂都在用的数据分析软件

限时免费的数据分析软件

新锐产品推荐

消息通知
咨询入驻
商务合作