编者按:本文来自微信公众号“知IN”(ID:Intelzhiin),作者:CSDN App,36氪经授权发布。
本文作者:屠敏
习惯是用来养成的,但往往也是用来打破的。从微处理器起家,英特尔在52年的历程中奠定及巩固了其在芯片领域的地位,以至于时下但凡提及芯片设计、工艺等关键词之际,映入众人脑海的巨头企业必然有英特尔的身影。
不过,近几年间,除了传统的处理器层面,在人工智能、大数据、云计算、物联网领域,英特尔依托强硬的硬件基础、创新的软件实现了数字智能化的快速转型,甚至在其内部“以数据为中心的业务”大有赶超“以PC为中心业务”之势,这一点也在不久前英特尔最新公布的2020年Q1财报中得到了验证。
据财报显示,英特尔Q1营收为198亿美元,与去年同期的161亿美元相比增长23%。从更为细分的部门业绩来看,英特尔客户计算集团即以PC为中心的业务净营收为97.75亿美元,其他以数据为中心的业务,如英特尔数据中心集团Q1财季营收为69.93亿美元、英特尔物联网集团营收为11.37亿美元、英特尔非可变存储解决方案集团营收为13.38亿美元、英特尔可编程解决方案集团营收为5.19亿美元。
对此,我们也不禁好奇,对于科技巨头而言,转型并非一夕之间可以实现,英特尔在面向以数据为中心时,是如何一步一步完成转身,并逆袭传统业务的?
或许,这可以从英特尔为现代数据中心打造的「三驾马车」说起。
英特尔数据中心的「三驾马车」
早在2017年,英特尔就已确立“以数据为中心”的战略转型目标,随后提出制程&封装、架构、内存&存储、互连、软件、安全为六大技术支柱,以软硬件齐发的招式,破解数据爆发式发展下的处理、存储、安全等种种挑战,也让在摩尔定律下的芯片迎来新的生机。
经历了几年转型的蜕变,事实证明,英特尔以数据中心战略并没有走错,同时,在计算、存储、网络的三驾马车鞭策之下,更大的数字能力得到了释放。
数据处理——第三代英特尔®至强®可扩展处理器震撼发布
众所周知,一直以来,“计算”是英特尔独特的优势。在这一层面上,正如英特尔公司数据平台事业部副总裁,英特尔至强®处理器和存储事业部总经理Lisa A. Spelman所言,“英特尔一直致力于为至强处理器注入AI训练和AI推理功能。从第一代英特尔至强可扩展处理器开始,就加入了AVX-512,并优化了FP32。在2019年,英特尔继续进行了相关改进,在第二代至强可扩展中引入了英特尔深度学习加速技术,从而显著提高了基于INT8推理的性能。随着第二代至强可扩展产品的推出,英特尔将至强拓扑优化的数量从24个增加到44个。”
经过一年的迭代,英特尔于日前推出了第三代英特尔®至强®可扩展处理器,也是业界首个内置bfloat16支持的主流服务器处理器,能够帮助图像分类、推荐引擎、语音识别和语言建模等应用的AI推理和训练更简便地部署在通用CPU上。
如今,bfloat16指令集技术的实现,不仅是英特尔在AI应用上的一大突破,而且也极大提高第三代至强处理器的处理速度,并达到相似的模型精度。目前,第三代至强可扩展处理器是当前唯一最多可提供8插槽可扩展性的x86平台,同时为应对更为严峻的数据分析挑战,它也支持最新一代英特尔®傲腾™持久内存。
存储——英特尔®傲腾™持久内存200系列
在存储方面,“所有工作负载都需要数据,但是当今的内存/存储层次结构存在鸿沟,需要在容量,速度,成本和持久性之间进行取舍。在存储金字塔顶部,成本很高,容量很小;在底部,容量实际上是无限的,但是访问数据的速度很慢。”Lisa剖析道。
针对这一点,英特尔在其丰富的3D NAND和傲腾技术研发经验之上,推出了英特尔®傲腾™持久内存200系列,它也被称之为“英特尔的下一代持久内存模块”,可支持前所未有的内存容量,并以最快的速度访问持久存储的数据。与第一代产品相比,英特尔®傲腾™持久内存200系列的平均内存带宽增加了25%。
如果在意外断电的情况下,傲腾持久内存200系列提供的CPU对持久性数据的访问速度比主流NAND SSD读取数据快225倍以上。与DRAM不同,在计划或计划外重新启动后,数据不必重新加载到内存中。
除此之外,英特尔还推出了高性能的英特尔®傲腾™固态盘和高容量的英特尔®3D NAND固态盘,其中全新英特尔3D NAND固态盘D7-P5500和P5600,基于英特尔最新的三层单元(TLC)3D NAND技术而打造,可为AI和大数据分析负载实现性能与容量的更优平衡。
首款针对AI优化的FPGA Stratix 10 NX
值得关注的是,基于人工智能方面的研究,英特尔还推出了首款针对AI进行优化的FPGA——Stratix 10 NX。它采用了EMBI整合封装,并嵌入了一种新型的AI优化块AI Tensor,专注于加速AI应用程序,可以在相同的空间内容纳15倍的计算量。
Stratix 10 NX还支持高性能AI推理,包括高速存储器和高速收发器。另外,英特尔是基于小芯片的架构策略,因此能够快速开发Stratix 10 NX设备。预计这款经过AI优化的FPGA,将于今年晚些时候上市。
英特尔为何要pick人工智能?
基于以上,我们不难看出英特尔在以数据为中心的战略之下,人工智能的应用对算力、效率的提升具有无限的潜力。而在我们回看英特尔的转型之路时,Lisa表示,“人工智能和分析将是未来十年起决定性作用的工作负载,推动以数据为中心的领域从云到边缘的颠覆性创新。IDC预测,2023年AI系统的支出将达到979亿美元,是2019年375亿美元支出的2.5倍多。在摩尔定律和云效率的帮助下,人工智能正从最复杂的组织转向渗透每一个应用程序。”
如今随着机器学习、深度学习等算法的不断成熟,为AI带来了更加具象化的效果,也让数据的价值呈现最大化,AI的推理和训练功能愈发完善。在应用层面上,对于英特尔而言,人工智能可以将数据从负担变成机遇,并将应用落地到各行各业,此外,5G的普及与发展也将从根本上改变大家对计算的看法,并要求所有网络进行转型。
当下,是人工智能落地应用的最佳时机,也是英特尔乘风破浪的机遇。因此除了硬件,英特尔也从软件、生态系统为核心,All in AI。
英特尔的软件之路
其实,作为传统的硬件厂商,在将软件列入最新技术产业支柱之际,我们已了然软件对其的重要性。事实上,在国内的上海,英特尔有一个超2000人的英特尔亚太研发中心,聚焦云计算、服务器设计、虚拟化技术、大数据、深度学习、基本输入输出系统、固件、视频技术等软件方面。
在性能优化与工具层面,英特尔正在通过异构编程神器oneAPI建立一个统一的编程模型,为开发人员提供统一的体验。同时,英特尔oneAPI跨架构工具生态系统使开发人员能够为AI、HPC和其他计算密集型应用程序提供更好的性能和高效的开发。
另外,英特尔推出的OpenVINO发行版工具包是用于开发AI应用程序的软件工具集,其重点是加快对诸如计算机视觉,音频,语音等用例的推理,实现了高性能计算机视觉和深度学习视觉应用的快速开发。
针对该工具,英特尔于近日推出了该工具包的新的长期支持(LTS)版本,它提供了一致、稳定的版本,仅针对关键错误修复(为期一年)和安全补丁(为期两年)进行了更新。这对于对代码稳定性有着极高要求的物联网客户而言尤其重要。凭借这些高级工具,开发者可在英特尔CPU、GPU、FPGA上实现AI工作负载的加速,并使代码可以在目前及未来的英特尔处理器及加速器上得以兼容。
打破生态系统的壁垒
最后,从公有云提供商到OEM平台,英特尔AI技术的身影无处不在。为此,英特尔还对其精选解决方案组合进行了全面升级,以更好地帮助企业IT部门加速部署最迫切的需求,这同时证明经过预先验证的解决方案交付能够在如今快速迭代的商业环境中充分展现价值。
在开发者生态上,在我们不完全熟知的背后,英特尔拥抱开源实则已经20年有余,不仅如上述提到的oneAPI、OpenVINO等工具,还有NLP架构、RL Coach、神经网络Distiller等人工智能框架及模型均可以在GitHub上获取。
对于英特尔而言,正如其发言人所述,「生态系统就是一切」,通过应用程序工程和开源社区的支持,英特尔在借助AI走得更快的同时,也希望能为业界AI开发者降低开发的门槛。
本文仅代表媒体观点
文中图片等素材的版权归其所有者拥有