人工智能算法的训练以及应用的部署,都离不开运算能力的支撑。作为人工智能三大驱动要素之一,算力决定了人工智能发展的速度与高度。作为算力的重要组成部分,AI 芯片近年来引得众多企业纷纷布局。
据市场研究机构 Tractica 预测,全球 AI 芯片市场规模将由 2018 年的 51 亿美元增长到 2025 年的 726 亿美元,CAGR 将达 46.14%。据 IDC 预计,到 2025 年,中国将拥有全球数据量的 27.8%。对于算力的巨大需求让中国 IC 产业面临严峻的挑战,但也蕴含了极大的机遇。
登临科技是一家专注于为数据中心和云端市场提供高性能可编程通用人工智能计算平台的高科技公司。
“我们的 AI 芯片和市面上其他产品很不一样的地方就是,我们从核心架构上解决了效率和通用性的问题。一般来说,有一个悖论认为,定制化的芯片效率会比较高,而通用性好的芯片效率会比较低。我们的芯片同时解决了这两个问题。”登临科技创始人兼 CEO 李建文说。
登临科技的方案是一套自主创新的 Minsky™️ 体系结构(软件定义的异构人工智能计算平台),它可以被看作是在摩尔定律之外,升级芯片性能的另一种路径。
摩尔定律,指半导体单位面积中的电子元件每 18-24 个月会翻一倍。同时,每当电晶体数目加倍,就能达到更低功耗。不过随着芯片技术的不断发展,“摩尔定律”也逐渐遇到了物理法则的限制,出现了“放缓”的迹象。目前,晶体管的体积已经达到纳米级别,继续缩小的可能性正逐渐变小,“摩尔定律”也已逼近极限。
在摩尔定律趋缓的今天,AI 芯片的架构创新成为新的方向。同时,芯片迭代和软件/算法迭代的速度之间存在巨大差异,AI 行业尤甚。AI 的算法和模型日新月异,专用芯片研发到量产周期漫长,往往无法满足最新算法和模型的需求。所以过往 AI 芯片在落地过程中同时面临通用性和计算效率的双重挑战。
李建文介绍说,Minsky™️ 体系结构在提供兼容 CUDA/OpenCL 硬件加速能力的前提下,全面支持各类流行的人工智能网络框架及底层算子,相比英伟达公司目前主流云端推理产品 (T4),登临科技的产品在同样的工艺上,以更小的芯片面积,在同样功耗的情况下,视不同 AI 网络可将计算效率提升 3-10 倍,同时也减低了芯片性能对外存吞吐的依赖。
登临科技成立于 2017 年底,利用了近三年的时间专注研发。公司的第一代产品 Goldwasser™️ 已在 2020 年三季度量产,该产品目前正在与包括互联网、安防等领域的龙头企业合作集成及业务测试。
登临科技面对的是一个由 AI 芯片巨头英伟达垄断的市场。“2017 年公司成立的时候,我们就做了市场调研,发现不论美国还是中国的互联网公司,基本用的都是英伟达的产品。现在 3 年过去了,情况基本没有改变。”李建文说。
对于企业来说,更换云端 AI 芯片要额外承担迁移成本和风险。所以除非新产品相比老产品确实有过人优势,否则这个市场很难撬动。
“我们需要思考的一个核心问题是,如何才能拿出富有差异化的产品去跟大公司竞争。”李建文认为,登临科技的产品优势在于“性价比”。
李建文介绍,登临科技的第一代这个产品 Goldwasser™️ 跟英伟达目前比较主流的推理芯片工艺相同,但在同样功耗条件下,性能能达到对方的 3-10 倍。“其实这样对客户来讲,我们的产品相比大公司还是有一定的性价比优势的。”李建文说。“我们考虑的出发点不是去低价竞争,而是把性能做得更好。”
另外,Goldwasser™️ 与现有的 GPU 产品具有兼容性,也就是说企业客户原本在 GPU 及 CUDA 平台上开发的程序,也可以无缝迁移至登临产品上。
小企业与资金雄厚的大公司争夺同一块市场,还有一个不能忽略的问题。登临科技的技术被复制的可能性高吗?
李建文比较乐观。“像英伟达这样的大公司往往专注渐进式的创新,就是不断让自己的产品比前一年更好一点。不像新创公司可以摆脱现有的约束。另外,我们的整个系统架构的核心技术在中国和美国也都注册了专利,受到知识产权的保护。”李建文说。“很多时候大公司做决定并不是去简单地考虑自己有没有能力去做一个小公司能做的事情,而是要考虑整体的商业模式、管理方式、组织结构等等多个方面。这也导致了它们更倾向于去做渐进式的创新。”
李建文是高科技的连续创业者,并兼具半导体大型公司高层管理和引领新创公司的经历。此前曾担任图芯公司研发副总裁,任职期间同时负责团队建设、管理、产品定义及客户拓展。由其负责的 GPU/GPGPU 产品在市场上赢得了包括飞思卡尔、美满、英特尔、谷歌、三星、诺基亚等客户的认同。图芯于 2015 年并入芯原且已在科创板上市。
目前登临科技在上海、成都、硅谷有三个中心。上海作为总部主要负责架构和硬件设计,成都负责系统软件验证,平均在行业内的工作经验超过 15 年。
目前为止登临科技已经完成了 2 轮融资,投资方以国际及国内主流投资机构为主。