人工智能公司当然是有“硬科技”的
作者|桑明强
和过去的消费互联网类似,近几年人工智能行业多少有点到了分水岭的意味。一方面,不同场景的解决方案有所区隔,让标准化这件事门槛变高;另一方面,Gartner虽然在《2021年AI成熟度曲线》提及机器学习、边缘AI、决策智能在内的创新会对市场产生变革性的影响,但短期内想突破这些技术桎梏并非易事。
在这种形势下,“拐点在哪”以及“如何破局”成了一众玩家正在思考的关键命题。尽管AI业态延展的不确定性在加剧,但数字经济和数字化这件事已经成为业界共识,从AI明星企业的崛起,到新基建、东数西算的战略实施,如果说前者是二级市场的正向反馈,那么后者就是产业级的框架搭建。
一直以来,人工智能被视为帮助人类突破科学技术进步认知障碍和认知边界的一个重要工具,这些年逐渐从幕后走向台前,以微软为代表的“智慧的工具”、特斯拉为代表的“聪明的车”,包括扎克伯格所押注的“元宇宙”,均掀起了行业级的变革浪潮。按照AI的三要素(数据、算法、算力)来划分,如果说过去是数据和算法的繁荣时期,那么现在显然是算力发展的黄金年代。
根据中国信通院测算:2021年,算力核心产业规模已经超过1.5万亿元,其中云计算市场规模超过3000亿元,IDC(互联网数据中心)服务市场规模超过1500亿元,人工智能核心产业规模超过4000亿元,算力产业支柱作用愈发凸显。
通俗来说算力就是计算能力,指的是数据的处理能力,小到手机笔记本,大到超级计算机,算力存在于各种智能硬件设备中,过安检时的每一次人脸识别、发消息时的每一次语音文字转化,都需要硬件芯片的算力支持。可以这么说,算力的大小就代表着对数字化信息处理能力的强弱,也是衡量一家AI公司含金量的关键指标。
最近两年,大算力的确定性,一定程度上拨开了AI行业的云雾。国际上很多科技公司包括谷歌、特斯拉、Facebook等,不惜斥巨资建设人工智能计算中心,国内的很多政府和企业也躬身入局、建设新一代人工智能基础设施。但也有观点对此持严谨态度,在刚刚结束2022中国算力大会上,商汤科技联合创始人、AI大装置事业群总裁杨帆认为,“当我们在谈算力的时候,必须要想好算力到底能给我们带来什么价值。”
从过去业务层面的生存抉择、疲于追赶,到现在基础科学的底层创新与博弈,很明显,国内的AI行业和玩家们正站在一个历史新拐点上,一场新的角逐也才刚刚开始。
我们常说当今世界正经历百年未有之大变局,体现在数字经济上,就是以数字技术核心驱动力的新一轮科技革命和产业变革正深刻影响着经济增长路径和生产力发展方向。这是一个值得重视的现象和深入研究的命题,前些日子任正非就曾指出:大算力时代已经到来,我们正在转弯,我们要理解并参与到这个时代的改变。
过去这些年,国内的算力产业发展速度非常快,且与当前的数字化发展基本保持一致。根据中国信通院院长余晓辉给出的一组数据,近5年中国算力产业规模平均增速超过30%;无独有偶,根据此前OpenAI发布的一项研究表明,AI训练中使用的计算能力每3到4个月就会翻一番。只不过,人们没有料到的是,芯片的算力会有到达极限的一天,也没有想到芯片算力极限会来得这么快。
此前麻省理工学院的研究人员就曾发出过算力警告——深度学习正在逼近计算极限,这也是当下算力产业的痛点所在,即产业下游对AI算法和应用场景的需求愈发多样,给上游软件设计和芯片硬件架构的协同提出了挑战。通俗的讲,算力是智能时代的新生产力,这点毋庸置疑,但问题出现在对“生产力”的利用率维度上,因为大家不知道的是,算力有多重要,它就有多昂贵。
早在1961年,算力被定义之初,美国约翰·麦卡锡教授就曾提出过算力应该像水、电资源一样随用随取的设想,类似于当今的云计算,把算力进行基础设施化,但遗憾的是,时至今日,这个设想依旧面临着很多核心技术挑战。举个简单的例子,眼下的很多AI芯片核心是利用乘加计算阵列来实现卷积神经网络中最主要的卷积运算的加速,但MAC阵列的大量运算会造成功耗的增加,所以如何达到优异的性能功耗比一直是AI芯片研发的关键目标。
但这并不是没有解法的,国内一些AI玩家也尝试给出自己的解题思路,甚至在某些方面走在了国际前面。以SenseCore商汤AI大装置为例,它是商汤前瞻性打造的新型人工智能基础设施,它以商汤AIDC(新型人工智能算力中心)为基座,将深度学习平台和模型层有机整合,让算力能被更好的解耦、利用的同时,也实现了批量的算法模型生产、部署和迭代升级。
换句话说,大算力的问题不仅仅是技术问题,也是成本问题。业界曾有人作过一个比较形象的比喻:如果把GPU比作是大巴车,AI的计算任务就相当于旅游团,在传统的算力分配模式中,无论计算量大还是小,都会占用一个硬件单元,就像小团体出游,却包了整个大巴,这无疑是一种资源浪费。
这其实也是如今人工智能行业的一个关键矛盾——技术成本和商业化的不匹配。如果AI解决一个问题,自身所花费的成本和代价,远比解决这件事带来的好处要大,那这件事就要认真思考,因为归根结底,算力也好,算法也罢,初衷是为了能更好地解决问题,实现相对正向的商业化结果。
如前文所述,时下大算力的一个关键命题是如何解决长尾需求,但在实际的应用场景中,从算力到终端需求的链条很长,其中包括了算力硬件、算力调度管理软件、能力平台软件、场景解决方案服务,每个关键环节之间是上下游串联的关系,任何一个环节的缺失都会影响到最终算力落地应用的效果。
这是智能时代给算力提出的最高挑战,因为智能的本质是对数据的深度加工与精炼,依赖算力、算法将数据训练成模型,进而实现包括通用人工智能、可解释人工智能甚至是类脑智能等在内的智能建模,最终形成以大模型为代表的智能时代,这也是“风投女王”徐新口中的AI时代三要素:一个好的解决方案必须做到算力、算法和数据的象限聚焦。
我们还是以比较典型的商汤科技为例,它对大算力的投入是很笃定的,据悉,在上海临港,商汤兴建的人工智能计算中心AIDC今年开始投运,拥有3740P的峰值算力,同时也是当前亚洲最大的人工智能计算中心之一。在商汤方面看来,现在的任务是,在搞清楚未来的AI对算力、数据、算法需求空间的同时,还要清楚自己的定位:当有了更好的AI基础设施后,到底能给各个行业的用户和客户,创造什么样的价值。
在2022中国算力大会商汤人工智能基础设施创新论坛上,由淄博市政府牵头的中国北方AI算力创新中心正式宣布启动
在商汤科技联合创始人、CEO徐立看来,“AI大装置的本质是让AI落地摆脱人力密集的状态。”他认为AI之所以人力密集,是因为生产效率不高,而生产效率提升的关键,是生产要素的成本得足够低,按照徐立的“机器猜想”,靠人脑的方式可能永远赶不上宇宙膨胀的速度,如果要真正解开宇宙真理,可以试着用更大的数据,更强的算力,或许还会撞出更多预期之外的结果。
以智慧城市为例,今天整个城市级的服务和综合治理,可以通过大量的视频处理和分析,更加自动化的完成,当然,同时也意味着需要更好的AI基础设施和更好的算力支持。目前,AIDC在山东也落地了诸多产业应用,包括智慧园区、智能遥感、智慧医疗、智慧教育等,基于商汤AI算力创新中心这一城市级产业算力底座,让“智都”这张淄博的新名片也慢慢浮出水面。
某种程度上,“商汤模式”并不复杂,其实就是构建产业级生态的方式和逻辑,即以AI算力创新中心为支点,支持中心城市及周边地区企业落地AI服务,从而形成发散式的产业链结构,虽然很多方面还有待验证,但它也为国内AI行业趟出了一个可行的样本。
这很容易让我联想到《云网融合:算力时代的数字信息基础设施》这本书,作者李正茂曾在书中作过一个比较形象的说明:如果说互联网是智能时代1.0,算力网是智能时代2.0,模型网是智能时代3.0,那么从信息的角度来看,电信网解决了数据联网,互联网解决了信息联网,算力网将解决云联网,模型网将解决算法联网,这样才能彻底完成信息的基础设施化。
有这么一种说法,当电力成为基础设施或者说成为工业时代的主要驱动力的时候,人类才算真正地踏进电汽时代,同理到算力时代,尽管今天的互联网和算力的渗透已经无处不在,但还远远不够,我们必须得承认现在的人工智能,充其量只能说是算力黄金时代到来前的第一枪。
随着深度学习网络模型越来越通用,参数规模越来越大,它对算力的需求,在过去几年也翻了大约50万倍,平均下来每年十几倍的增速,甚至超过了对算法精度增长的需求。另外,行业中也开始出现越来越多的长尾细分需求,虽然这些应用频次较低,但是一旦出现会发生不可逆的影响,产业巨大的商业价值,也就是说,这张“算力地图”上还有很多黄金等待挖掘。
回到一开始的讨论的话题,怎么去理解大算力才是检验人工智能的关键指标,其实这里包含了2层意思:1、大算力当下要解决的,是“场景升级”逻辑,而不是互联网口中的“颠覆”逻辑,所以需要扎根到最底层的场景需求中去,做到“因地制宜”;2、大算力的根本目的是大幅降低人工智能生产要素的成本,同时也是最难的点,就像物流领域的“最后一公里”难题,它是必须要跨过去的一道坎。
本文来自微信公众号“新眸”(ID:xinmouls),作者:桑明强,36氪经授权发布。