编者按:本文来自微信公众号“36氪”(ID:wow36kr),36氪经授权发布。
当用户能够与设备商和上游企业紧密的站在一起,计算的可能将无所不能。
因为极度的轻资产化,互联网被誉为创业者的天堂。但在云计算出现之前,互联网却与其他工业并无区别,高产出仍旧建立在高投入之上。
云计算的出现改变了行业,但无法改变经济规律。背负着整个行业的基础架构,云计算企业只能在规模和效率中寻找利润点。于是,云企业开始在包括风火水电、土建、管理在内的所有方向发起冲击,试图利用技术和设计降低成本,而在这之中当然也包含了计算。
看电影的不一定就能拍电影,开车的不一定会造车,这是常识。那么作为基础架构产品的用户之一,互联网真的能造好服务器吗?
熟悉数据中心的人一定会对Open 19、OCP、ODCC这样的标准不陌生。脱胎于互联网定制服务器,这些标准均是由各大互联网企业(包括运营商)联合服务器、存储上下游厂商共同成立的数据中心开放计算项目;其核心目的便是将服务器、机柜、供电、散热标准设计从上游厂商的手中转交至用户手里,这样,用户便可以根据自身面临的问题和实际需求来定制整个数据中心的设备和管理标准。而互联网企业面对的核心问题便是成本和管理。
通常,出于供应链安全考虑,企业的大规模采购不会将所有订单交给同一家供应商。但在数据中心的非定制时代,不同设备商在服务器内部设计思路、管理界面、配置方面都会有所不同;这就使得不同品牌的设备之间存在很多互操作性上的不确定。正如同木桶原则所揭示的道理一样,在云计算这个由多种设备共同构成的复杂水桶中,与其购买规格参数参差不齐的多块“木板”,让规格最低的木板决定最终的盛水量,倒不如自己确立标准,让所有“木板”都尽量做到一样长,进而避免浪费。
因此,在各类开放数据中心标准当中,互联网企业所关心的并非绝对品质和性能,而是更标准化的设计和备件,更好的可替代性,更全面、更有深度的技术扩展性等等。谷歌、Facebook、领英、腾讯这些顶级互联网企业也能够构建自身的硬件基础架构平台。
作为全球互联网巨头,腾讯云不仅要承载腾讯自身的游戏、视频、直播、媒体、即时通讯等多方面的业务,更要面向百行百业提供智能、全面、高性价比的基础设施和各类服务及解决方案。经过七年的高速发展,腾讯云2019年业务规模超过已170亿元,年增长超过50%。(数据来源:https://tech.qq.com/a/20200318/028923.htm)
在腾讯云所面对的千差万别的海量需求当中,企业关键业务是其中相当重要的一类。他的外在形式可能是数据库服务、可能是数据分析服务、可能是主机托管服务,也可能是政务、医疗影像、线上课堂、金融风控等不同行业解决方案。但撇开软件堆栈和应用领域的差别,他们对基础架构都有着相同的要求——高性能、高可靠。
以往,企业会通过采购昂贵的主机并构建主备系统的方式来解决性能和业务可靠性问题。但对于云服务提供商来说,这些技术方案既无法与现有的云原生架构兼容,也不够经济、不好维护。如何在满足可靠性需求的同时兼顾平台在管理和运维方面的经济性?腾讯云给出的答案是采用第三代英特尔®至强®可扩展处理器(Cooper Lake)的腾讯云星星海系列首款自研四路服务器产品。
细看产品名称,明眼人便能找到其中的两个核心关键词:首款自研、四路。
星星海系列服务器是腾讯云星星海推出的自研硬件系列产品,专为大规模部署和管理运维而生;除了对管理标准、网络、电源、散热等数据中心基础要素的细致优化之外,更具备优秀的互操作性,可以大幅降低基础架构的运维难度和工作量。而这便是腾讯云星星海系列服务器通过自研所获得的价值。
四路第三代英特尔®至强®可扩展处理器(Cooper Lake)作为关键业务计算平台的主流配置,也能够为腾讯云提供强大的性能和众多集成化的RAS特性。
而面对更广泛的通用型业务,成本更低、更实用的双路配置则是用户偏好的选择。因此,在推出星星海系列首款自研四路服务器产品的同时,腾讯云星星海也没有停止在主流领域的创新,基于即将正式发布的第三代英特尔®至强®可扩展处理器(Ice Lake)双路平台,腾讯云星星海新一代自研双路服务器也于近日揭开了面纱。
1、四路扛鼎之作——腾讯云星星海系列首款自研四路服务器
作为面向关键业务计算平台,四路或以上配置是必然的选择。因为四路平台不仅能够提供更多的核心数量、更大的内存容量支持、更好的物理隔离;更因为包括可调节地址内存镜像备份技术、板卡实时恢复、机器故障恢复等在内的很多硬件级RAS特性也只会出现在四路产品及以上平台中。因此,在平台的具体选择上,腾讯云星星海系列首款自研四路产品采用的是第三代英特尔®至强®可扩展处理器(Cooper Lake);这既是目前市场的主流之选,也是经过众多应用验证的合理选择。
在性能层面,第三代英特尔®至强®可扩展处理器(Cooper Lake)平台单主板最多支持4处理器插槽,并能够通过UPI连接扩展至八路配置。相对于单路系统,集成DL Boost技术的第三代英特尔®至强®可扩展处理器(Cooper Lake)能够在四路配置下提供2.48倍的单精度性能和3.78倍的半精度性能。换句话说,在经过优化的深度学习所对应的推理等应用场景中,第三代英特尔®至强®可扩展处理器(Cooper Lake)做到了几乎线性的性能提升。
当然,性能只是腾讯云星星海系列首款自研四路产品平台优势的其一。在腾讯云和最终用户更看重的高可靠方面,支持机器故障恢复等一系列高级RAS特性的腾讯云星星海系列首款自研四路直接将宕机发生概率降低了50%。换句话说,由宕机所带来的负载迁移、数据和状态恢复以及后续的维护工作量也将减少一半。对于腾讯云的运维压力和用户口碑来说,这样的提升就是事半功倍。
2、双路海量部署——腾讯云星星海新一代自研双路服务器
如果说腾讯云星星海系列首款自研四路产品是腾讯云切入企业关键业务场景的尖刀利刃,那么面向大规模虚拟化应用的双路服务器平台则是腾讯云庞大产品目录背后的中流砥柱。换句话说,在这一面向主流应用场景的服务器设计中,腾讯云星星海系列服务器所追求的除了性能、密度之外,便是大规模部署的成本便利性。
作为服务器的核心,腾讯云星星海新一代自研双路服务器选择了即将发布的第三代英特尔®至强®可扩展处理器为核心平台(Ice Lake)。新处理器采用10nm工艺制造,每核心L3缓存数量为1.25MB,并集成包括英特尔®AVX-512在内的众多先进指令集,能够为包括高性能计算、人工智能推理在内的众多应用场景带来更强大的性能。
与此同时,新平台还将支持最新的第二代英特尔®傲腾™持久内存,为包括虚拟化、分布式数据库在内的众多业务场景提供更大内存空间和更低廉的部署成本,使腾讯云能够在性能、成本和用户体验层面达到全新维度的平衡。另外,新平台不仅集成了众多源于四路及以上系统的RAS特性,更全面采用了免工具维护和模块化设计,使大规模虚拟化环境下的基础架构运行更稳定、运维更方便。
在以往的服务器设计中,散热和计算密度往往是一对不可兼得的矛盾体。但凭借先进的10nm制程和领先的散热及内部风道设计,采用第三代英特尔®至强®可扩展处理器(Ice Lake)的双路星星海服务器在实现计算密度提升50%的同时也做到了散热能力45%的大幅升级。
在2020年12月20日举办的Techo Park开发者大会期间,腾讯云表示,腾讯云星星海新一代自研双路服务器将于12月底完成首批部署并加入腾讯云产品矩阵。
3、腾讯云+英特尔+生态=更短的研发制造周期
大规模部署和快速上线是云计算企业在定制服务器时所考虑的另一个核心因素。这不仅是对腾讯云星星海团队设计能力的考验,更是对硬件合作伙伴供应链、制造能力、制造经验的全方位考量。所以,在生产制造等环节,腾讯云选择了拥有丰富互联网定制服务器经验的硬件合作伙伴,并与英特尔展开了紧密的合作沟通。经过三方团队的无间协作,腾讯云星星海系列新一代服务器的开发周期相较传统流程缩短了整整一个季度。而三个月对于兼具互联网和云计算属性的腾讯云来说则意味着市场拓展层面的巨大优势;毕竟,企业用户对新平台的热情从来都是高涨的。
“贴近用户”是所有商业模式取得成功的关键要素。但在从硅到电路、到处理器、到平台、到服务器、到数据中心、到云计算、再到数字应用的漫长产业链条中,上游厂商贴近用户的难度可想而知。
不过,作为顶尖的半导体企业,英特尔却走出了一条从硅到应用的独特路径。通过将产品战略扩展至包括制程与封装、XPU架构、内存和存储、互联、安全、软件在内的六大类,英特尔终于可以跳出传统的上游角色定位,实践以数据为中心的全维发展战略。丰满的产品线、完整的平台化技术堆栈以及强大的本土团队和全球生态也让英特尔有能力深入用户需求一线,与各类用户、供应商形成三方协作,共同探索半导体技术在数字时代方方面面的应用可能。
腾讯云并不是第一个投身互联网定制服务器的行业巨头,但正如后发先至的道理一样,早已看清前路的腾讯云从第一款星星海自研服务器的设计研发开始就展现出了成熟的设计思路和对应用场景需求的精确把控;在四路、双路服务器平台的选择和配置上,腾讯云与英特尔及硬件合作伙伴更是火力全开,展现了互联网定制服务器在配置、性能、可管理性和高可靠层面的顶尖水准。
能够以这样的平台拓展业务,是腾讯云的成功;而能够携手用户创造出这样的计算平台则是英特尔及其庞大生态共同努力的结果。当用户能够与设备商和上游企业紧密的站在一起,计算的可能将无所不能。