云计算厂商推出AI芯片成为一种趋势,最新的一家就是亚马逊。
在拉斯维加斯召开的re:Invent大会上,亚马逊发布了其首款云端AI芯片Inferentia。
Inferentia可用于机器学习推理,支持INT8、FP16精度,支持TensorFlow、Caffe2、ONNX等机器学习框架。亚马逊表示,一些推理工作负载需要整个GPU,这非常昂贵,亚马逊想要给出低成本的解决方案。
亚马逊云首席执行官Andy Jass介绍,单个Inferentia芯片的计算力有几百TOPS。将在2019年下半年推出,将用于EC2、SageMaker以及新推出的Elastic Inference云服务。与其他AWS服务一样,客户将能够根据使用量付费。
在此之前,云计算厂商中谷歌、华为、百度都已经推出了云端AI芯片。阿里平头哥未来推出的首款AI芯片也将用于云上。微软的Brainwave平台则是采用英特尔FPGA芯片。
谷歌在这方面最为领先,2016 年,谷歌首次公布了AI芯片TPU,次年5月的I/O大会上,谷歌宣布将TPU用于云端。今年7月,百度也发布了面向云端的昆仑芯片,量产时间尚未可知。10月, 华为发布了自研云端AI芯片昇腾910,基于达芬奇架构,采用7nm制程,将在明年二季度面世。
亚马逊AWS凭借先发优势,在云计算的竞争中一直处于领先地位。但近两年,云计算厂商蜂起,不光有微软、阿里的竞争,谷歌、IBM、腾讯、华为、金山也在拼命追赶。所有这些巨头厂商都把云业务作为未来的战略性业务。
据Canalys报道,2018年第三季度,全球云基础设施服务支出总额达到210亿美元,同比增长46%。亚马逊依然处于领先,占比32%,份额较去年同期下降了3%。微软Azrue市场份额额占17%,位居第二;谷歌云与阿里云分别以7%和4%的比率位列全球第三、第四名。
而在营收上,微软近期还超越了亚马逊。过去12个月中,微软以267亿美元的收入超越亚马逊(234亿美元),一跃成为全球最大的企业云服务提供商。
相比于其他几家,对于亚马逊而言,云计算的分量尤为重要。微软、阿里、华为并不依赖云计算带来盈利(当然微软已经盈利),而AWS已经连续两个季贡献亚马逊一半以上的盈利。今年二三季度,亚马逊盈利同比增长10倍以上,云计算的强势拉动是重要原因。
目前,亚马逊在云计算上依然有较大的优势,但是竞争压力也在不可避免地增大。另外,随着AI训练对云端的需求不断加大,亚马逊有必要在云端升级AI能力。对于亚马逊、华为、华为这样的巨头而言,自研云端AI芯片,一方面可以避免对第三方厂商的依赖,另一方面由于其体量庞大,自研芯片可降低成本,赢得价格上的优势。
在云计算这个赛道上,行业前四的玩家中,亚马逊、谷歌已经推出AI芯片,阿里也将会推出。未来的竞争中,大体量的云计算厂商自研云端AI芯片,几乎成为一种标配。
联系之前发布的云服务器CPU,还可以看出亚马逊更大的野心:走云、芯一体化路线,尽可能掌控更多的技术链条。
本周一,亚马逊推出首款自研Arm架构云服务器CPU Graviton,这些虚拟机现在可在美国和欧洲使用。
自研云服务器CPU的好处也与上面类似:一方面将降低对英特尔服务器CPU的需求,另一方面也是为了价格优势。亚马逊全球基础设施和客户服务副总裁 Peter DeSantis表示,使用这款CPU能让AWS虚拟机部分工作负载的价格降低45%。
目前亚马逊在公有云的规模上处于领先地位,并且在大体量的基础保持了快速的增长。而自研AI芯片和CPU,又将进一步降低成本。更大的规模与更低的成本,将形成飞轮效应,进一步巩固亚马逊在云计算市场的优势。