2018年,商业创新迈进新的阶段,商业创新在业务飞速发展的同时,伴随而来的也有风口大热背后的认知沉淀与实践积累。7月10日36氪联合《零售老板内参》举办的2018商业新生态峰会在北京举行。本届峰会以“质”为主题,希望新的时代浪潮下新商业企业可以看清商业本质,最终完成新商业的革新与升级。
随着产融结合的进一步发展,金融尤其是银行方面风控越来越被重视。
在今日举行的“2018年商业新生态峰会”上,知因智慧CEO任亮为我们讲述了如何通过AI连接金融产业,如何利用AI来发现金融领域里面的规律。
任亮表示,必须创造性地利用大数据和AI,帮助我们去更好的还原整个经济世界,更好的分析经济世界的风险和价值。
以下为任亮发言全文:
大家好,我是知因智慧的CEO任亮。很多人都说知因智慧的名字起得好,知其原因从而智慧,其实我在起这个名字的时候,真正的本意是知识基因或者叫智慧基因。我认为整个世界由两种基因构成,一种是推动物种进化的生命基因,一种是推动人文世界与经济世界发展的知识基因,我希望通过AI发现知识基因从而获得智慧。我自己从事金融行业,所以我们希望立足AI,去发现金融领域里的规律,获得知识基因,从而建立起产业的桥梁。
中美的贸易战已经开打了,所以下半年到明年我们会有很多企业受到影响,国家也在做七千亿的定项降准,这些钱如何流向实体产业和实体经济?我们认为最优解是通过产融知识图谱来解决当前的问题,所以今天我来跟大家分享一下如何通过AI连接金融产业,如何通过知识图谱去发现他们的规律。
我们先从世界杯谈起,足球界里有一套非常热门的战术,叫Tiki-Taka,梅西在这套战术中如鱼得水。它强调队友间的协同配合,避免单人作战,靠队友之间的区域跑位来创造空隙,从而赢得射门机会。
我们可以看到梅西在俱乐部踢球时,他的对手并不敢包夹他,因为周围的队友协同点很多,但是梅西在国家队时,战术施行的不那么完善,所以他常常会陷入重围,孤军奋战,于是我们可以得到一个结论:单点打不过网络,明星打不过系统。
如果做一个比方的话,我们谈知识图谱,可以说是我们人工智能领域里面的网络,因为它本质上就是一个语义网络,通过实体和关系的聚合建立网络,这个实体就是经济世界里面不同的对象、人和企业。同时它也是一套系统,因为它没有一个明确的边界,他可以把我们所看到的各种人工智能领域的方法和技术融合在里面,所以它非常强大。
去年有一篇文章叫做《为什么知识图谱终于火了》,探索了这么多年,大家可能发现在AI和金融这种需要高度专业知识的领域在落地的时候,知识图谱或许是一条最佳路径。我们来看一下整个智能技术发展的四个阶段,早期是专家系统,通过人来判断,之后是BI商业智能,一直到感知智能。今天我们谈大数据,人脸识别,图像、语音、文本等这些数据已经进入到我们的模型里,去帮助金融机构进行判断。再往后是认知智能,也就是人工智能建立起来的很多标签画像,通过识别个人,识别企业去判断它的信用。但是我觉得更重要的是现在万物互联,人在互联,经济也在互联,所以在一个互联的世界里面需要通过关系来去分析这个个体,我们不能仅用个人或者企业自己的数据分析它,而是要把它还原到网络里,用网络眼睛还原个体,于是知识图谱就成为了一项核心技术。今天我们谈产融知识图谱,核心的要义在于要把产业世界的一个关系体系建立起来,那么这个世界里面最核心的实体是什么?是企业,围绕企业建立起企业与消费者,以及企业与员工,企业与企业之间的关系,比如投资链、担保链、贸易链、供应链,通过这个企业建立起它跟上下游、行业、地域的关系,这三个层次的关系综合在一起叫做产业,通过大数据描述这个产业的实体和他们连接的类型,通过机器学习去提炼,这些实体和关系之间的规律和规则,所以我们把这三者融合在一起叫做产融知识图谱。
我们举几个例子来看一下产融知识图谱的表现形态,其实都是我们日常生活中间最容易理解的这些,比如说客户、控制关系、担保关系、资金关系等等,这些都是我们在股权方面的具体表现,包括供应链里面的上游、中游、下游原料商、批发商、生产商,这些不同的实体中间有不同的经济往来,这就是关系,这就是一个典型的知识图谱的例子。
更大范围的是产业链,一个产业通过他的上游和下游会建立起他们之间的经济依存关系,不管是新能源汽车还是房地产,它的原料和上下游,都是我们收集数据来构建网络的目标和对象,在金融行业不管你分析的是to C还是to B都是产业里的一个环节,都是一个实体。
现在一个难点是小微,小微获取成本非常高,而且风险非常大,怎么办?我们把小微企业聚集起来变成一个商圈,变成一个专业市场,这样获取对象会更容易获取一些数据,这些手段都是方便我们把原来孤立的个体放在网络里,更好的分析它。比如押品估值,房产本身价格在波动,而且价格变动是很多要素决定的,比如他周边的人口,经济变化,城市发展的策略等等。所以通过这些要素能去预测它的房价,房价的变动会影响我们金融里面的抵押品价值波动,这个会影响客户的信用,会影响用户所在群体的价值。我们从整个链条里面可以看到,这个经济世界是互联的,我们的大数据和AI就是要试图建立起这样一个网络,帮我们更好的还原整个经济世界,去分析他的风险和价值。
在产融知识图谱的框架之下,我们必须要创造性的利用AI技术,帮助我们去真正理解他们的规律,这些技术我们稍微总结一下,其实涵盖了整个产融图谱构建的全过程,包括了大数据和AI算法。
比如我们需要有领域知识的输入,因为我们做金融,金融一定有很多的领域知识,我们在判断一个企业和个人的时候,需要一个体系来判断,这些都是领域知识图谱。通过图计算,相关的各种算法去总结网络里面它们的特征。图谱构建完以后需要大数据来填补他们的关系去进行量化,除了我们最容易理解的结构化数据,BI技术之外,现在更重要的是需要把非结构化的数据也融合进来,前面有好几位嘉宾谈到了图像识别,这是非结构化数据的渠道,还有很多文本,特别像我们知因智慧着重在语义识别和文本识别上面,把非结构化的数据结构化,从而进入到模型里,量化之后我们去做预测。过去我们一直用概率统计模型,现在这个条件下仅用概率不够,我们需要做大范围的推理,需要去做量化和预测,然后把它运用到金融场景,去做金融事件的提炼,风险特征的发现,去做传导等等。
接下来我们来看,在刚才提到的体系下,金融场景是怎么影射的?其实我们最早的金融评估就是打分卡,对应的是我们的专家系统,后来引入西方的巴塞尔协议做内部评级法,这个就是我们的BI商用制度,现在通过万物互联和知识图谱获得模型,对应的就是认知时代,所以金融和AI高度相关。
纵观这段发展历程,金融方面我们其实一直在学习西方,同时也落后于西方,但是从产业知识图谱这个角度来看,中国反倒走在前列,为什么呢?因为我们有自己的现实问题,也有自己的独特条件,我们面对的现实问题是中国的企业关系网络高度复杂,而且风险频发,比如说十年前德隆系风险事件发生后造成了连锁性风险蔓延,所以这是我们面对的问题。另外我们中国的数据又比较集中,因为我们有强势的政府和监管,政府会收集大量的跨领域的数据,这为我们建模型创造了条件。其实我们早在十年前,2006年的时候就已经通过监管的牵头和驱动,在从事相关领域的研发和推进,当时我也非常有幸参与了整个过程。从风险集团事件的发现演进到2009年我们把这套体系和模型推广到商业银行的机构,开始做商业化的实践,并且在学术上我们第一次提出了一套基于关系网络和行为角度去建模的方法,而不再局限于传统的基于财物报表和评价的方法来去预测风险。
2009年再往后,我本人在中科院一直从事相关算法方面的研究,后来去IBM做金融大数据方面的探索,一直到2016正式创立知因智慧,我们数据产业的成熟,我们金融客户需求的爆发也推动我们做了很多标杆性金融事件,这些事件代表了我们产融知识图谱的方向,它所能解决的问题,的确可以跳脱传统的限制,在风险管理,精准商机的发现上取得更好的效果。
接下来我们看一下金融场景该如何应用产融知识图谱,在这个体系之下,最底层是3K平台,KW、KE、KG,这是知识图谱的三个核心组建。KE解决的是知识的进化过程,是包含AI算法的建模平台;KG是知识可视化平台;KW是核心的知识仓储,我们一直在采集大数据,但这些数据如何能够变成我们场景所需要的核心体系,在这里面我们叫知识仓储。举一个例子,比如说这里有实体库、关系库、标签库、事件库、语料库等等。我们以前识别一个人或者企业的时候需要分析它的ID,但如果没有ID该怎么办,怎么判断它是同一个企业?比如说IBM,IBM是一个简称,2016年大裁员是一个风险事件,而我们银行记录的是国际商业技术有限公司,这是一个全称,这两个词不匹配就不能纳入模型变量里,实体库就是解决这个问题。很多这样的内容我们把它打包在一起叫做知识仓储,通过这些支撑来建立客户谱系,我们把原来那些孤立的个体变成一个网络,包括产业谱系,客户谱系还有它的画像以及事件,原来我们看风险舆情,是客户经理自己去辨别,现在我们用机器能够读懂舆情,能够把舆情纳入到风险变量里,整个体系我们称之为AI盒子,通过AI盒子我们把这些工作整合在一起,赋能给公司金融、小微金融、风险管理、大资管、大零售等具体场景。
接下来我们通过一个个组件来理解一下整个产融知识图谱的实现过程。比如说谱系,谱系是图谱中的核心组件,通过它我们可以描绘它的股权关系,也可以描绘它的产业关系,这样我们才能完成把个体还原到网络里的第一个步骤。接下来我们要去计算它们的传导,他们的影响,在这个网络里面当一个点发生问题的时候,它对关联的点和其他的点都有什么样的影响,那么我们必须要去收集金融事件,并量化事件,必须要测算出传导路径,这就是我们的作用。谱系+事件这是我们整个K+盒子里面的核心内容。
举一些实例,一家股份制银行,通过图谱他能够建立企业客户的商机,精准商机的发现、准入和风险传达。那么通过小微金融,原来的数据获取可能只是一些片段零散的数据,我们通过谱系,通过小微个体经营行为的数据融合,我们去进行整个线上评估体系的建立。另一个例子,我们为一家电商金融企业做供应链预测,供应链里供货商未来增长的变化,它未来增长的精准预测。同样我们也需要构建一个知识图谱,把供货商跟他的产品还有消费人群这三者建立起关联,消费群体的变化和商品结构的变化一定会影响供货商以及其未来销量。
风险管理,原来我们都在基于每一个个体收集数据预测,现在我们把他在的网络建立起来,在网络里当一个节点发生风险的时候,我们把他所影响的范围测算出来,这里的核心在于我们连接权重参数的训练。所以当整个供应链,产业链建立起来后,我们就知道上游的一个风险发生后会对下游造成什么样的蔓延和冲击。
包括资管,这里面PE、VC产业链,通过特殊实体的构建,我们能够找出来一批发展非常快速而且也非常活跃的PE企业,从而为金融机构提供联动或者定制化的金融产品。整个体系里面包括一些核心技术,在这里面可以大家做一个罗列。刚才谈到的这些场景,在国内的一些标杆型金融机构,包括国有银行,股份制银行,金控,互金,都得到过验证。
最后一点,我们把刚才提到的内容变成了一个一体化的K-BOX,这个BOX把我们的算法、数据、云计算,融合成了知识图谱,去输送给金融机构,为它赋能,为它解决行业里面的痛点和问题。
以上谢谢各位!