6月8日,“2021金水科创大会”在郑州市金水区盛大开幕。本次大会由中共金水区委、金水区人民政府主办,郑州金水科教园区管委会联合36氪承办。大会汇聚科技领域的众多资深学者,以及200多家国内互联网知名企业和行业龙头企业代表。本次会议聚焦信息安全、人工智能、互联网经济等热点领域,共探科创产业发展未来,共促郑州科创产业集聚优势。
同时,大会邀请到了河南省委网络安全和信息化办公室、河南省发展改革委员会、河南省科学技术厅、河南省工业和信息化厅、河南省地方金融监督管理局、郑州市人民政府作为指导单位。
观安信息CTO胡绍勇在会上分享了自己对于人工智能的数据安全治理的看法,他认为,数据是这个时代最关键的生产要素,但也正是由于数据隐私性的问题,所以才会出现许多安全隐患。我们需要在人工智能的动态发展过程中来实现对整个数据安全风险的可管、可知、可控,也要充分发挥安全对人工智能发展的赋能作用。
观安信息CTO胡绍勇
以下为观安信息CTO胡绍勇演讲实录,36氪整理编辑:
尊敬的各位领导、各位来宾,我是观安信息的胡绍勇,很荣幸今天能够参与这次大会,今天跟大家分享的议题是人工智能的数据安全治理。
提到人工智能,绕不开今年的几个热词:新基建、新要素、数字化转型。今天给大家分享四块内容,一是当前人工智能的发展面临的数据安全挑战,二是介绍一下当前全球人工智能数字安全治理现状,同时提出我国人工智能数据安全框架,以及一些典型场景的数据安全解决方案。
一、数字经济时代的人工智能发展趋势
去年疫情以来,数字新基建、数据新要素等一系列新的发展已经影响了大家的生活,这些都离不开创新的基础设施建设。同时,一些创新的人工智能应用场景产生了新的数据,这些数据也成为了我们人工智能发展的一个核心动力和强大驱动。
人工智能核心的三要素是算力、算法和数据。当前,在线新经济产生了很多新的数据。今年我们国家提出了数字化转型,包括云计算、大数据、5G都带来了新的变革。数据成为了更关键的生产要素,但同时也面临很多安全威胁,比如今年5月份美国供油管道公司的勒索病毒。其实这些年企业和政府单位都面临着安全的威胁,比如窃取或是被勒索病毒加密等等。
当前,人工智能的发展从探索期进入到成长期,这里面有几个特点:人工智能的专业技术迅速突破,产业生态进一步成型,人工智能场景向深层拓展、深入到我们生活和工作的方方面面。
在人工智能发展过程中,我们也看到人工智能加剧了数据安全的风险,比如新的数据安全风险上的问题,甚至是一些人身安全或者社会安全上的问题。
二、人工智能全面新发展的数据安全挑战
人工智能典型场景下的安全风险,一是数据采集阶段,近几年国家工信部处理了一些违规APP,这些违规的APP多数是采集了个人的一些隐私信息。同时,国家在个人隐私和数据安全方面也加强了法律约束。
二是数据处理阶段,典型问题包括数据污染、数据投毒攻击以及数据偏差和歧视。早期的人脸识别可能对白种人或者亚洲人的识别效果比较好,但是对于非洲人、黑人的识别效果比较差,这就涉及到数据偏差和歧视问题。再举第二个例子,现在很火的自动驾驶汽车、无人驾驶,如果当它面临投毒攻击或者定向攻击,或者它本身的算法出现问题的时候,很容易导致车祸出现人身伤害,这也是和我们的传统计算机安全不太一样的地方,人工智能的数据安全出现问题的时候可能会引发一些社会安全上的问题。
在流通阶段,人工智能也有它的特点。数据是人工智能的核心要素,在数据处理阶段也产生了一个生态圈或者产业链,从数据的采集到数据的标注,不同厂商之间的数据在不断流通。这里面也会造成数据交互、数据孤岛这样一些问题,同时也会产生数据跨境的问题,就像前面提到的无人驾驶汽车,国外自动驾驶汽车可能要把它的一些数据传到国外的服务器,但是这些数据可能又会涉及到国内一些个人隐私的问题,甚至会涉及到一些涉密地方道路的隐私问题,这可能也会影响到国家的一些安全。
所以,前一段时间大家会看到特斯拉准备在国内建造数据中心,就是为了不将这些敏感数据传输到国外。包括在后面的处理阶段也会面临一些抗样本攻击等典型的人工智能攻击场景。
三、全球主要国家人工智能治理现状
再看主要国家人工智能的治理现状。美国提出了《人工智能公开数据计划》,欧盟在《数据安全法案》里面将一些特定的人工智能场景列入其中。一些国际化组织也都在一些安全倡议和伦理规范里面强调了人工智能和数据安全的问题。
美国、欧盟和中国的治理现状存在一些差异。美国更多是通过一些场景化的立法,比如说在自动驾驶、人脸识别,在各个州先提出场景化的法案;欧盟是在统一的法律框架下针对一些典型的,像自动驾驶、人脸识别等重要场景提出了数据安全相应的条款;我们中国目前还在加快推进数据安全立法包括人工智能的立法,不管是《个人隐私法》还是《数据安全法》当前已经进入到草案阶段。
四、全球人工智能数据安全前沿技术方向与实践
那么,人工智能治理的思路和框架又是怎样的?
首先,因为安全是为整个发展做出赋能的,而不是为人工智能创造一个枷锁。所以,我们要在人工智能的动态发展过程中来实现对整个数据安全风险的可管、可知、可控,也要充分发挥安全对人工智能发展的赋能作用。
我们提出四项治理原则:一是促进和鼓励人工智能的发展,保护主体权益,因为人工智能很多算法在应用过程中要采集一些个体的数据;二是重视技术赋能,通过一些技术手段解决人工智能风险问题;三是聚焦行业场景,比如说人脸识别或者自动驾驶等场景,进入很多场所的时候要刷码或者人脸识别,要关注这些商场和企业有没有将识别后的人脸数据妥善保管,是不是存在泄露风险,这些都是典型场景;四是从标准上和法律法规上推动多元参与以及加强国际合作。
基于原则和思路我们提出了四点治理路径:一是加快完善人工智能数据安全治理的顶层设计;二是聚焦重点场景人工智能数据安全的标准体系,包括标准计划、通用标准、行业标准以及地方标准;三是不断提高人工智能相关企业自身的数据安全防护能力,这个防护能力不光是技术的,还包括组织建设、流程建设、人员建设;四是打造全面立体的人工智能数据安全能力供给。
五、人工智能场景数据安全技术解决方案
第一,我们在去年上海举办的世界人工智能大会上发布了人工智能数据安全检测平台,这个平台能够实现对企业人工智能应用平台的评估,包括数据质量评估、数据差异评估以及人工智能应用的底层平台的漏洞评估,同时也能够针对人工智能的一些技术、数据采集环节,比如敏感数据、偏见数据的检测进行相应的数据安全风险检测。
第二,我们也发布了针对无人驾驶数据安全的解决方案。无人驾驶场景存在的数据安全风险首先是传输和存储环节敏感数据被窃取的风险,二是数据过度采集和越界使用,现在可以把无人驾驶比喻成大型的智能终端,你经过的一些地方的三维图片已经被人工智能车辆采集到了。这个场景下,我们关注的一是加强车载的防控以及实现分域的管理,二是PKI或者数据通信加密,三是提升整体车联网的网络态势能力。
第三,针对人脸识别的数据安全解决方案。这更多是由于企业内部自身的网络安全防护能力不足,有泄露敏感数据的风险。人脸识别有可能在一些场景下识别精准度比较低,也存在数据安全风险。基于这点,首先需要企业加强核心人工智能平台的准入,包括认证和控制,确保整体数据链路的安全。同时,也要重视数据共享安全,因为很多人脸识别数据、训练过程中的数据可能不是一家产生的,会由多家公司提供或者共享。最后,要实现整体可追踪溯源。
第四,针对工业互联网数据安全的解决方案。工业互联网多个层次之间都存在数据安全,因此,工业互联网企业要优先建立好数据防泄露圈层,二是对关键核心数据包括数据库实现数据安全审计,三是通过数据脱敏实现数据安全的交换和共享;四是通过人工智能技术,基于上面的子系统进行整体数据安全的分析和数据安全的预警,来实现整体工业互联网企业数据安全。
以上是我今天分享的主要内容,谢谢各位!