在7月13日晚上11点左右,B站突然宕机。随后,“B站崩了”话题冲上微博热搜榜第一。一时间谣言四起,有的说是因为B站大楼服务器着火了,有的说服务器被攻击了。
虽然当晚23点57分有@上海消防微博通报辟谣,B站官微自身也就“部分服务器机房发生故障造成无法访问”致歉。
但到7月14日0点30分左右,B站网页端和移动端大部分功能才恢复正常,视频播放和直播功能可正常使用,但个人收藏、动态、消息等功能尚未恢复。
直到14日凌晨2点15分左右,B站所有功能均恢复正常。但宕机三小时才恢复,对于B站这个拥有2亿多的月活App来说,也是个可以载入史册的事故了,以至于第二天晚上B站宣布给所有注册用户赠送一天的大会员。
但B站的宕机事件,也把“大厂服务器”问题拉到了台前。
为什么服务器会宕机呢?
一般是两种,自身原因和外界原因。
自身原因很好理解了,服务器就是更高级一点的电脑,是电脑就会有内存和CPU,即使大公司会有很多服务器,但内存和CPU的运算能力总归是有上限的。
同一时间服务的请求越多,内存消耗量就越大。一旦在同一个时间需要服务处理的数据超出服务器空间限制,造成资源耗尽,就会导致服务器宕机。
当然正常运算时也会可能出现宕机,但服务器的稳定性极高,这种情况出现概率极小。
外部原因就好解释了,一个是网络攻击,通过恶意病毒植根大量用户的电脑设备,制造伪装成多个虚假IP地址,然后对服务器在短时间内发起大量请求,来使服务器宕机。
另一个就是如机房断电、机房温度过高,或者这次B站宕机谣言里说服务器起火,都会导致服务器宕机。
而这么多的服务器宕机原因,最后造成的结果,除了最直接的服务器宕机之外,还会导致服务器丢失大量数据,如果服务器服务的用户和企业众多,那么还会给企业带来巨量的经济损失。
比如2019年10月22日,亚马逊遭人为攻击,部分宕机,导致客户网站濒临崩溃;2018年3月2日深夜,阿里云突然出现宕机故障,导致华北区域众多网站和App都无法正常使用;2018年,腾讯云出现重大故障,广州区域部分用户出现资源访问失败、控制台登录异常等情况。
那么解答了这么多关于服务器的基础问题后,核心问题来了,既然服务器的安全这么重要,大企业都会把自家的服务器放在哪里呢?
在贵州贵安的山洞隧道里,藏匿着腾讯的贵安七星绿色数据中心。这个数据中心被称“全国最安全的大数据中心”。
这个位于贵安新区马场镇川心村栖凤坡山体内的隧道数据中心,总占地面积约为770亩,隧洞面积超过3万平方米。
内部总共有5横1竖,6个隧道,5个横向的隧道中,一个是油库动力隧道外,其余都是IT设备洞,长度都超过220米,而竖向的隧道则是为了起到通风和隧道间联系的作用,并且每条隧道上方都有竖井,总共11个,来用于通风散热。
据腾讯对安全性方面的解释,数据中心隐藏在群山当中,建成后的外景没有明显标识,同时所有核心设备都处于洞内,日常运行时没有人值守。
并且还具备战时防护能力,可防相应级别常规武器和核武器的打击。里面还有网络、主机、业务3级云安全布防,并且还应用了人脸识别、安防机器人这些人工智能技术,甚至还部署了无人机入侵防控系统。
无独有偶的是,华为和富士康也在贵安新区建设了自家的数据中心。
比如华为,甚至就将自家的七星湖数据中心,建在腾讯的数据中心隔壁的山头上,两个山头相隔不到百米。占地大约有1600亩, 服务器大概60万台,用来存储华为在170个国家的管理数据。
而且计划将在贵州贵安还有更多大型知名企业,如高通、电信、移动、联通、现代汽车、中兴通讯等等。
贵州到底有什么好呢?
贵安新区大数据办编撰的《贵安新区绿色数据中心》里提到,贵州的年均气温14℃到16℃,夏季平均气温低于25℃,植被覆盖率80%以上,没有恶劣天气。常年温度比较平均,不会过高过低,这也使得贵州的气候很适宜服务器运维。
同时贵州所处位置为稳定的地质带,不会发生地震、火山或洪水等其他自然灾害。
更重要的是,由于服务器运行需要空调等散热设施进行大量散热,所以电能消耗是数据中心运维成本中最大一笔开销。 而贵州有丰富的电能,再加上当地政府大力优惠政策,最低电价0.35元/度,而数据中心建成当时,全国数据中心聚集省份工业用电价格显示,全国均价是0.77元/千瓦时,便宜了近一半。
山体稳定,温度恒温适宜,电价又便宜,难怪腾讯为首的这么多公司会选择贵州建造数据中心。
前面的腾讯、华为是将服务器放在山里,那么与腾讯同属中国互联网企业“二极”的阿里,则是将自家服务器放在湖里。
这是阿里的千岛湖数据中心,2015年9月正式运营,总建筑面积30000平方米,共11层,可容纳至少5万台设备。
数据中心在服务器运行时,会通过管道,将湖水从35米深的湖底抽取上来,来给服务器降温,降温后还未结束,湖水还会流到2.5公里之外的青溪新城中轴溪,成为城市景观的一部分,直到水温在环境中自然冷却后,重新回到千岛湖内。
由于千岛湖地区年平均气温只有17度,这种方式,让数据中心90%的时间都不依赖湖水之外的制冷能源,只用深层湖水制冷,比传统的空调制冷方式要节约能耗超过八成,全年下来可减少碳排放一万多吨标煤。
而且千岛湖还有一个作用,除了被阿里当作数据中心的“降温器”,还是农夫山泉的水库之一,可能我们喝的农夫山泉的水就曾流经过阿里的服务器机房哦。
山河湖海,山河湖都有了,就差海了。
没错,大名鼎鼎的微软公司,就将自家的服务器设备放到了深海里。
微软将把数据中心放在深海底的项目称之为Natick计划。
Natick是取自美国一座小城市的名字。这个“水下数据中心计划”最初是从2014年开始筹备,直到2015年8月才进行实体实验。
第一次实验里,近300台台式电脑计算能力的服务器,被装入了一个重达17吨的钢制密封舱内,然后在舱内舱外各安装了一台冷热交换器。
冷热交换器里面装满淡水,通过内外淡水交替循环来散热。
第一次测试成功后,微软在2018年又再一次实验,这次他们就选择了苏格兰附近的奥克尼群岛。
这一整个数据中心包含了864台服务器和27.6PB(大概可以存500万部高清电影)的存储设备,就这样被整体沉入35米深的海底。
为什么微软会选择将数据中心放进海里呢?
除了本身深海可以降温,还因为微软的海底数据中心是模块化概念的,而全世界有一半以上的人口都居住在海岸线20公里以内,所以将数据中心分块放置在沿海城市的海域中,可以大大降低数据传输的时延。
其次,一个数据中心模块从规划到落地部署只需要90天,比在陆地上建立数据中心要快很多,且据微软表示,水下数据中心的故障率仅为陆地数据中心的八分之一,运维成本非常低。
目前一个数据中心模块,可以在水下持续运行5年免维,在使用寿命结束后,还可以再进行回收利用。
但由于Natick计划目前还是一项应用研究项目,没有完全转成商用,所以远不及我们国内企业几个完全成熟的方案更加使用。
山河湖海都全了,是不是还得来点更极端的?
这就要属“蜥蜴人”扎佬的facebook了。
Facebook的Node Pole数据中心,位于瑞典吕勒奥镇边沿的森林中。 而吕勒奥镇位于波罗的海北岸,离北极圈只有100公里,所以这是一个冰天雪地再走远点可以看到北极熊的地方。
Node Pole数据中心从2013年开始运行,在2017年6月份才向外界公开。从图片可以看到,它的外部由数以千计的矩形金属板组成,长300米宽100米,差不多四个足球场大,周围则是大片的松林、湖泊和群岛。
这个也是Facebook首次在美国以外的地区开设数据中心,是欧洲最大的数据中心之一。
内部来看,就像《银翼杀手》中的场景:金属色的狭长的走廊嗡嗡作响,服务器蓝光闪烁,风扇高速运转,像是高速运行的银色怪兽。
至于选择这个北极圈的小镇作为数据中心的地点,是因为吕勒奥镇自1961年以来,全年超过30度的时间加起来,不超过一天。而在冬天,平均气温都在零下20度。
这个数据中心可以充分利用瑞典的寒冷气候,冷空气被过滤器和雾化器处理后,再像水一样“冲洗”服务器,服务器产生的大量热空气再和进来的冷空气循环交换,进行自然冷却。
而且瑞典还拥有大量的、廉价的和可靠的电力能源。在大约一个世纪之前,瑞典为帮助国内的钢铁、造纸等工业发展修建了水电大坝,但随着部分产业的衰落,这里的电用不完了,这些富余的电能就可以被利用。
而且据称它是有史以来最高效节能的计算设施。一般来说,普通的数据中心平均消耗3瓦特的能量,2瓦特用于电力和冷却,剩余的1瓦特用于计算。相比之下,Node Pole数据中心的这个比率仅为1.04:1,比一般数据中心环保两倍左右。
希望能看到服务器送上火星的那天。
本文来自微信公众号 “锌财经”(ID:xincaijing),作者:梅浩宇,编辑:大风,36氪经授权发布。