首页 >热门资讯> 数据分析 > 数字浙江公司CTO陈鹏宇:数字化改革的公共数据治理实践 | 解码数字新浙商No.60(上) >

数字浙江公司CTO陈鹏宇:数字化改革的公共数据治理实践 | 解码数字新浙商No.60(上)

转载时间:2021.07.13(原文发布时间:2021.06.07)
149
转载作者:36氪企服点评小编
阅读次数:149次

“大家好,我叫陈鹏以(宇),我系(是)广西壮族寄几七(自治区)的。”陈鹏宇是广西人,上大学前没接受过标准普通话的训练,自我介绍时引得全班哄堂大笑。为了攻克发音,他抱着字典苦练拼音3个月。工作后,需要用到新的编程语言,他揣着一本厚厚的user guider从头啃起。

2010年加入阿里巴巴时,他取“不老”为花名,勉励自己以“笨小孩”的心态,慢慢啃、步步走,耐心应对困难、探索未知。2019年,陈鹏宇加入了阿里巴巴驻浙江省政府团队(数字浙江公司前身),同年11月,数字浙江技术运营有限公司成立,服务于政府数字化治理和数字化转型。

作为公共数据生态领军者,数字浙江公司正沿着数字化改革的路径,赋能数字底座建设。陈鹏宇协同政府部门、技术团队开启了一场解开公共数据治理“绳结”的实践。比如在全省建成的“数据高铁”,已“发车”8亿多次,有效解决了数据不及时、不完整等“老大难”问题。

“脑海里想象一列高铁,运载着数据,让数据从起点站直达终点站”;“数据好比水,蒸发后要下雨回到海里,下雨的过程称为数据回流”……在90分钟的采访里,陈鹏宇一一解释了数据高铁、数据回流、数据飞地等技术原理。

有区县邀请他前去讲解数字化改革,他准备了几十页PPT,整整讲了2个小时,举了15个涉及政务服务事项的例子,打了8次比方,摆了10组数据,期间无人离席。“我从在座的人的眼神里,感受到他们确实听懂了”。

万物皆数——古希腊人毕达哥拉斯的预言,正在变成现实,不仅要变数字为生产力,还要从数字中寻求“智治”的新模式和新路径。望向更远的未来,陈鹏宇像鹰一样明澈的眼睛里,闪过一道光,“我的终极梦想是建立地球数仓,让全国乃至全球的数据流通起来,创造价值。”

嘉宾介绍

陈鹏宇(花名不老) 深耕数据领域18年,阿里云数据智能产品化主推手,国内第一代企业数字化转型、数据智能的专家和实践者,数据中台的第一代布道师,浙江省公共数据开放运营和数据要素市场化配置新理念的提倡者。长期致力于政企共建营商环境、企业数字化转型、数字政府、工业互联网等领域的探索研究。同时作为既懂政府也懂企业的跨界数字化转型专家、一线实践者,始终站在数字化变革的最前沿,引领并倡导着先进技术和发展理念。

谈“笨小孩”心态

很多事情没有捷径,我选择缓慢而坚定地生长 

章丰:你信奉“笨小孩”文化,这让我联想起刘德华有一首歌叫《笨小孩》。

陈鹏宇:“笨小孩”其实是工作中的态度,是一种慢慢啃、步步走、踏实的、耐心的心态。2003年毕业后,我一直从事大数据、数据库领域的研究。互联网公司讲究快节奏,一个想法从产生到落地非常快。2018年我来到数字浙江公司,服务于政府数字化转型。政府客户的特性促使我们必须保持谨慎而又科学的服务态度,每项落地应用都有可能触碰到各部门间的职责壁垒,权衡解决好这些问题,好比一个复杂的“绳结”。但我发现,就算这“绳结”再拧巴,当我以一个“笨小孩”的心态一点一点、一步一步地把难题啃透,绳结迟早会解开。

2017年以来,全省上下启动“最多跑一次”改革,以群众办事事项为切入点,聚焦省级100个群众办事高频事项,推进事项标准化和数据共享。数字浙江的主要任务就是打通数据孤岛,实现数据归集共享。为了做好改革的技术支持,2018年春节,我打印了政务服务各个申请事项的办事指南,带回家仔细研读。

章丰:真正的聪明人都肯下笨功夫。

陈鹏宇:这种方法对我比较适用。小的时候,我想弄明白收音机里面为什么有人在说话,于是用了笨方法——动手拆,尝试拆了去搞懂原理;上大学的时候,因为我的普通话口音重,我就抱着字典读拼音苦练了3个月;工作后需要用到全新的编程语言,我就从厚厚的用户手册开始“啃”……很多事情没有捷径,我选择缓慢而坚定地生长。

谈数字化改革

打造“整体智治”的服务型政府,打通公共数据是核心

章丰:数字化改革元年大幕拉开,数字浙江公司是改革的重要技术支撑。畅想有一天,数字化改革已经深入到各个领域,会是怎样一番图景?

陈鹏宇:数字化改革着眼于整体,通过跨部门的数据共享、流程再造和业务协同,打通和整合党政机关各项职能,最终转型成“整体智治”的服务型政府。什么是整体智治?未来在数字世界中,政府所有的部门、层级、地区之间的边界都会消融,每个功能板块独立存在,却互相协同。形象地说,政府就像一个完整的人,心、肝、脾、肺、肾、四肢、五官共同工作,成为协同的整体。

目前,政府内部运行依然是分条分块的。但对群众而言,整体政府却是他们心中的朴素要求,他们认为政府天生就是一个服务整体。小孩从出生、落户到上学,能否“一条龙”办理?房屋过户涉及到多部门,手续繁杂,能否一次性办完?开办店铺、企业,跑一个部门就能办结?这些场景都需要我们把政务服务变成综合应用,让群众和企业办事从“找部门”转变为“找政府”。所以数字化改革提出了“综合应用集成”的概念。

章丰:最近读到一个报道,某地大数据局一位领导感慨,“过去改革靠文件,现在改革靠软件;过去办事看脸面,现在办事看界面。”

陈鹏宇:以前老百姓办事得看一些部门的脸色,现在政府的政务服务能力不断提升,政府得看老百姓的“脸”办事——刷脸完成事项办理。刷脸办事理论上不难实现,但真正实现业务通、系统通、数据通还有很多瓶颈。全省有上千家开发商,做了上万套信息系统,系统之间有巨大的技术壁垒,数据的有效性需要统一认证,业务联动也需要各方联调才能对接成功。

章丰:站在数据技术专家的角度,你认为实现数字化改革最大的痛点在哪? 

陈鹏宇:打通公共数据,是数字化改革最大的核心、最大的变化、也是最大的内涵所在。数据孤岛时代,政府部门就像一座座山头,古代打仗靠烽火台传递消息,但我们要靠人充当“人肉U盘”,跑腿传递数据。数字化转型就是要在各山头架设信号塔,接通信号,让数据像水一样在不同部门之间畅通流动。就像以前千岛湖的一千座小岛互不相通,湖水一来,岛和岛连通了,可以开船,可以潜水。

所以锁在机房里的数据,一定要“广播”出去,从私有数据变成公共数据。数据通了,业务流程通了,系统通了,政府部门的服务就能实现螺旋式的优化提升。老百姓也将看到政府从分散、割裂走向整体、高效,这就是改革。

谈数据高铁

数字化改革的一把“手术刀”,浙江的一张金名片 

章丰:关于公共数据治理,我注意到你在演讲中提到过“数据高铁”,数据高铁怎么理解?

陈鹏宇:现在不少地方已经用“数据跑腿”代替“群众跑腿”,老百姓办事不用来回折腾,但如果数据本身“跑”得不够快会发生什么?我例举一个实际调研过程中碰到的案例:一对台州的夫妻在民政局办理结婚登记,一周后他们去公积金中心办理公积金贷款,却被告知暂时查不到结婚信息,无法办理贷款。这可能是因为民政系统的信息没有及时传递到公安户口系统所致。

试想,数据翻山越岭地从“娘家”到“婆家”,哪怕是邮差徒步从台州民政局途经省大数据局、政务服务业务系统再到公积金中心,一周也足以送达。所以在数字化时代,数据共享不及时、信息失真,是棘手的技术挑战。

数字浙江公司CTO陈鹏宇:数字化改革的公共数据治理实践 | 解码数字新浙商No.60(上)

数据归集链路如同“黑盒子”     图由受访者提供

据统计,过去平均一条数据从采集单位到使用单位,传输时效慢,就像坐“绿皮火车”,归集过程繁杂,各环节如同“黑盒子”。数据在其中平均中转六七次,任一环节出现故障,都会导致数据遗失、错误,数据一旦丢失,无从知晓哪一环节出了问题。

“数据高铁”完全消除了数据供应链的中间环节,让数据从“起点站”直达“终点站”,保障数据供应一条不漏、一条不差,从根本上解决数据“跑得慢”“跑丢了”的问题。整个过程从数源的生产系统日志中直接读取数据变更,实现秒级、分钟级的数据实时更新。比如,民政系统刚录入婚姻信息,马上全省可用,公积金办理无缝对接。

数字浙江公司CTO陈鹏宇:数字化改革的公共数据治理实践 | 解码数字新浙商No.60(上)

数据高铁

章丰:把供需链路拆掉,直接点对中心,这对原有的责任体系也会有所影响?

陈鹏宇:原有的数据归集链路是数源一层层往下游“推”到公共数据平台,越到下游把关越难,也越容易松懈,真出现问题容易推诿扯皮。如今,数据高铁做到直通数源,需求侧可以直接从源头“拉”数据,责任在谁也变得简单明了。

在解决数据高铁的权责关系中,我们沉淀了一个宝贵的经验——“统分”思想:省大数据局来“统”,负责出工具、定规范、提要求、做考核,各部门来“分”,各自使用数据高铁工具自主配置采集数据。相当于车头和车厢是大数据局提供,各设区市各部门自己发车,大数据局作为统一的调度中心,井然有序地监管整个数据供应链体系,实现全链路数据可量化、问题可定位、责任可追溯。

目前,全省已经开通了36条高铁,“发车”8亿多次,基本建成了覆盖全省的五跨的数据资源实时调度的网络,在政务服务、行政执法、金融风防和应急响应等领域都发挥着作用。

数字浙江公司CTO陈鹏宇:数字化改革的公共数据治理实践 | 解码数字新浙商No.60(上)

数据高铁开通前后部分数据归集时间对比

章丰:数据更快的连通不仅方便群众,更能释放出巨大的治理效能。无障碍流动的数据背后,是原有的管理层级和界限的消弭,会带来更为扁平化的结构。

陈鹏宇:数据高铁是浙江省的一张金名片,也是数字化改革过程中打磨出来的、用于政府数字化转型的一把“手术刀”。它就像蚯蚓松土一样,运送全省的数据资源,支持政府业务的在线和连通,从而实现整体智治,为老百姓提供整体的政务服务。

谈数据回流

数据好比水,蒸发后通过下雨回到地面,下雨的过程称为“数据回流”

章丰:数据高铁可以实现高效的数据汇集,但还面临一个问题,数据上传到上级平台后,往往很难再回流基层。  

陈鹏宇:这是个好问题。如果把数据比作水,水蒸发上天后,又通过下雨回到地面,下雨的过程我们称为“数据回流”。数据回流有两层含义:从狭义视角看,是数据在政府内部从省级平台回到基层;从广义看,是政府通过数据开放把数据反哺给社会各领域各行业。

现阶段数字化改革首先要解决狭义的数据回流,我们采用了迂回的方案。数据汇集后统一存储在省公共数据平台上,市县通过在省公共数据平台上建数据仓的方式,共享使用全省数据,就像省平台是一个大租户,各地市和区县都可以来这里租一块属于自己的空间,我们形象地称之为“数据飞地”。 

章丰:“飞地”在物理世界我们比较熟悉。比如未来科技城的衢时代。数据飞地的机制在数字世界是怎么运转的?

陈鹏宇:以衢州为例,衢州市为了调用省里的数据,可在省级公共数据平台上建设自己的实时数据仓(数据飞地),相当于快递中转站,省里把要寄的包裹(数据)批量放到快递网点(衢州市的数据飞地),再寄回衢州分发到客户(数据需求侧)。衢州的数据飞地与当地的公共数据平台互通,衢州也可以将本地的数据上传到飞地里,进行数据采集任务配置、数据加工,以接口的方式回到市公共数据平台。这样一来,市本级部门的数据又和省级部门的数据做了一次融合。

数字浙江公司CTO陈鹏宇:数字化改革的公共数据治理实践 | 解码数字新浙商No.60(上)

数据飞地示意图 

同理,柯城、开化、龙游等都可以到衢州市公共数据平台开区县仓,实现市域范围内所有数据的融合。融合的数据可以再分配,切一刀给开化,切一刀给其他区县,由此形成数据回流的体系。飞地使用省级数据安全相关的制度和工具,受省大数据局的监管,同时又能够大规模地被市区县使用。

数字浙江公司2019年就专门成立了部门研究数据回流问题,在数字化改革系统协调的理念和要求的推动下,目前全省已经有超过250个仓,涵盖全部11个地市。

数字浙江公司CTO陈鹏宇:数字化改革的公共数据治理实践 | 解码数字新浙商No.60(上)

省市县三级平台全链路建设情况

章丰:打通了数据回流的通路,还面临数据如何使用的问题。我们想象中数据是一堆混沌的状态,如何变成可用的形态?

陈鹏宇:我用点菜打个比方:假设今天医保局要点“出生医学证明”这道菜,如果数据归集没做好,相当于还要去地里拔菜、去养鸡场杀鸡拔毛。如果我把这些菜(数据)提前整理切配好(对数据进行归集、治理、编目等处理),炒成不同的菜品(形成基础库、主题库等),数据就从原始状态变成可用状态了。然后点菜方到传菜的窗口(可接入的数据服务接口),就可以享用了。目前我们正在优化数据的查找、申请、审批的过程,把“点菜系统”的体验做到最优。 

章丰:非常形象,架构也很巧妙。

陈鹏宇:在数字化改革公共数据平台的架构中,最底层的数字基础设施是政务“一朵云”,往上就是数字资源体系,通过数据归集、数据清洗、数据高铁、数据回流、数据挖掘等一系列技术,让全省的数据在其中共享流动。

数据高铁、数据回流(数据共享)是其中最核心的部分,它们分别代表了数据的收集和下放,一来一回的双向通路促进了省市县数据充分的互通流动,为数字化改革铺平了技术道路。无论从理念上,还是技术上,这种设计都是浙江的首创,也是浙江改革精神、创新精神的体现。

谈数据开放

除了技术完备,还需要商业、人文、伦理等方面的配套准备

章丰:在数字浙江的架构中,过去、现在、未来,公共数据和市场化数据是一种怎样的关系?

陈鹏宇:这个命题很有意思,它涉及到数据开放的概念,也是数据回流的广义视角。所谓数据开放,就是政府将管理的公共数据逐步开放出来,鼓励企业与社会公众利用数据资源开展创新,从而发挥出更大的价值。

过去数据开放探索了两种模式,都走到了死胡同:一是信息公开,可公开的数据非常有限而且价值不大;二是数据交易,面临权属、定价和衍生使用的问题,目前法律尚无明确界定,所以数据本身很难作为可买卖的商品。

章丰:政府内部产生了大量公共数据,但更巨量的数据来自市场。

陈鹏宇:真正有价值的数据往往是有主体归属的。假设数据权属、定价及可衍生性等问题都解决了,数据开放还面临动力和利益分配的问题。所以我们提出了“还数于民”的方法,首先由政府搭建一个独立的、有公信力的第三方平台,帮助企业和个人储存数据。

章丰:相当于在政府支撑的第三方机构里建立数仓? 

陈鹏宇:是的,我们称为“数据宝”。第三方机构相当于数据银行,装着各种证照证明,如纳税情况、社保情况、就医情况等,这些数据可能来自政府,也可能来自别的机构和社会主体。

政府面临两个问题:一是独立的数据平台如何以市场化的方式运行,同时在政府监管范围内,具备政府公信力;二是政府作为独立的数据供给方,如何将数据提供给平台,形成先行示范。 

针对这些问题,我们建立了“三解锁”机制,每一次的数据开放都必须经过数据托管方(政府)、独立数据平台、数据拥有主体三方共同解锁,最终供数据使用者使用。就像从支付宝里把余额转给别人需要本人授权一样,“数据宝”也需要经过授权后才可读取个人数据。

数据流通不再是机构间交易数据的模式,而是消费者随身携带自己的“数据档案”,在享受不同场景服务的过程中自然而然地带动数据流动。 

章丰:你认为像这样的数据开放服务,应该用怎样的商业形态和模式来支撑?

陈鹏宇:每年浙江都会举办数据开放创新应用大赛,挖掘优秀应用,推动落地孵化,今年是第二届。数字浙江公司也在协助政府做一些合理的数据开放尝试,比如将食品经营许可证数据开放给饿了么;将省内所有停车场的实时空停车位数据开放给高德;把家政人员的从业资质和健康数据开放给家政服务平台等。

如果数据开放,应该由服务提供方来付费,因为服务提供方基于数据可以提高服务品质,获得更多客户。比如家政服务平台付费获取可靠的保姆信息;银行通过征信数据的评估发放更多贷款省规避风险;保险公司可以设计更多险种来精准匹配不同人群。

章丰:我联想到e签宝的模式,按次数购买电子签名服务,其中有小额的,也有免费的应用先让用户建立信任机制。从技术的角度看,你认为“数据宝”处于怎样的阶段?

陈鹏宇:今天在技术上基本已具备数据开放的初始化运作能力。技术的关键点在于:数据的标准化对接;数据仓的隔离性和安全性;数据以什么形式呈现;数据调用后如何跟踪和限制。所以需要不断发展相应的技术手段,加强风控体系。

章丰:技术往往是在使用过程中进化迭代的。 

陈鹏宇:除了技术完备,更需要商业、人文、社会伦理等方面的配套准备。从商业准备度来看,政府、各大机构的数据汇聚后提供给各大服务商,挖掘出多少数据的价值,产生多少业务增值,将影响市场化的机制。政府作为数据的供给方,本身也可以购买数据来优化服务。目前我们在衢州已有相关试点,政府从数据宝里购买数据应用于项目的研发。 

章丰:改革从“靠文件”到“靠软件”是一步大跨越,要攻克技术难关,要克服制度摩擦力,但是一旦开跑,迭代会特别敏捷。我相信你描述的未来,也会比预想中更快到来。

陈鹏宇:我也相信随着数字化改革走向深处,数据价值将不断放大,且没有天花板,将会涌现出更多新的应用场景。

整理 | 蒋雷婕

编辑 | 王小猛

转载 | 合作 | 约访 请联系:

微信号 wangxiaomeng0425

36氪企服点评

数据分析相关的软件

大厂都在用的数据分析软件

限时免费的数据分析软件

消息通知
咨询入驻
商务合作