本文来自微信公众号“机器之能”(ID:almosthuman2017),作者:Sarah Wang、Martin Casado,编译:吴昕,36氪经授权发布。
硅谷顶尖风投a16z 的投资人 Martin Casado 因提高技术经济学对话水平而声名鹊起。去年2月,他与 Matt Bornstein 合作发表的一份针对AI 行业的分析在国内科技界广为流传。通过分析和采访AI公司高管,他们发现 AI 公司毛利率较低,这一成本中心也给企业扩展带来挑战。
最近,Martin Casado 再度与同事合作,将科技经济学分析指向云基础设施成本。Martin Casado 和 Sarah Wang 详细分析了50 家上市软件公司财务报告中的企业云支出。他们的结论是,在大规模运营时,云的成本可能会使公司的基础设施费用增加一倍。基于云成本对利润率的影响,估计有 1000 亿美元的市场价值因此而流失。
该分析在硅谷引发大量争论,其中不乏十分尖锐的反驳。有人直指作者 「对云的看法完全错误」,云的好处与收入有关,而不是成本。对该问题的正确的打开方式毋宁是 「对云成本进行 ROI 分析。而不是根据价格便宜做出决定。」重点在云优化,而不是成本。
文章提及的Dropbox 例子还让科技界重新审视了「回迁(repatriation)」这个棘手的问题,即数据和工作负载从云转移到本地基础设施。这真的是一种趋势吗?现有调查中,有的指向肯定答案,有的显示缺乏这方面有力证据。
尽管公有云账目中的工作负载可能还没有大量外流,但入场成本仍然值得研究。Martin Casado 指出,他们的研究进行的基准测试发现,云支出约占商品成本或 COG 的 50%,对于一家大型企业来说,最高可达 80%。Casado 和 Wang 指出,通过在云上花费如此高的 COG 水平,多达 5000 亿美元的市场价值会因此流失。
文章最后,作者提出一个关键点。如果他们是对的,并且企业决定对此采取行动,那么主要的云提供商将需要做出关键的决定。是降低价格并牺牲利润率,还是坚定不移地接受工作负载损失?
以下为正文:
毫无疑问,云计算是计算历史上最重要的平台转变之一。云计算不仅已经影响了数千亿美元的IT支出,而且还尚处起步阶段,并在每年超过1000亿美元的公共云支出基础上快速增长。
这种转变基于一个非常强大的价值主张——基础设施立即可用,也正好符合业务需要的规模——提高了运营和经济效率。
云计算还有助于培养创新,因为公司可以释放资源,专注于新产品和增长。
全球范围内企业在云和数据中心上的投入情况。蓝色为数据中心的支出(包括软硬件),橙色为云服务的投入情况。——译者注。
然而,随着云行业经验的成熟——我们可以从公司经济状况中窥见更完整的云生命周期——越来越明显的是,虽然在公司早期阶段,云服务清楚兑现了它的承诺,但随着公司规模扩大和增长放缓,云服务给利润率带来的压力可能开始超过收益。
这种转变往往发生在公司生命周期的后期,因此很难逆转。这也是开发工作多年来专注新功能而忽略优化基础架构的结果。为了显著提高效率而进行的重写或重大重组可能需要数年时间,这通常也被认为是不可能的。
现在,人们越来越意识到云计算长期成本的影响。随着云成本开始对总收入成本 (COR) 或销售成本 (COGS) 产生重大影响,有些公司采取了引人注目的措施,「回迁(repatriation)」大部分工作量(比如Dropbox),也有些公司采取了混合方式(比如CrowdStrike和Zscaler)。据报告,采取这些措施的公司成本节约显著:2017 年,Dropbox 在其S-1 中详细说明,由于基础设施的全面优化,IPO 前两年累计节约支出高达 7500 万美元,这主要因为从公有云「回迁」了大部分工作量。
然而,考虑到此类努力规模之大,以及「云是伟大的」这一占主导地位、有些独特的行业叙事,大多数公司发现很难证明,将工作量从云上转移出去是合理的。(的确如此,但我们还需要考虑更广泛的影响。)因为评估失去的潜在市场资本规模时——我们在这篇文章中所作的——计算方法会发生变化。通常,增长会随着规模增长而放缓,短期效率越来越成为市场价值的关键性决定因素。云计算的超额成本会导致利润率下降,进而严重影响公司市值。
不过,这篇文章的重点并不是要讨论调回工作量;这是一个非常复杂的决定,其造成的影响也因公司而异。毋宁说,我们是想了解云计算究竟抑制了多少市值,这样当公司规模化时 ,我们就能为管理基础设施的决策框架提供一些帮助。
先介绍一下文章的脉络:我们预估,在极端情况下(亦即,将工作量从云端完全调回)能节省多少成本,并使用公开数据估算出其对股价的影响。结果表明(基于相对保守的假设!),与自己运营基础设施相比,目前五十家使用云基础设施的顶级上市软件公司的云账单拖累了公司利润率,市值损失规模大约在1000亿美元左右。分析关注的是软件公司,但该影响绝不仅限于软件。将这一分析扩展到那些受益于转移工作量的更广泛规模的上市公司,市值损失规模可能超5000亿美元。
文章分析中涉及到的公司。
我们的分析强调了无论通过系统设计和实现、重新架构、第三方云效率解决方案,还是将工作量转移到特殊用途硬件上,优化云计算可以给公司带来多大价值。鉴于主流观点都在谈论云与本地部署,我们的分析无疑会显得非常违背直觉。然而,显而易见的是,当你将云计算对市值的影响和近期节省的支出考虑在内时,任何降低云成本的举措都会因为公司规模不断变大而获得其合理性与正当性。
为了对云成本进行维度化,并了解优化到底能节省多少钱,让我们从更极端的大规模「回迁」案例开始:Dropbox。
Dropbox在2016年启动其基础设施优化计划时,通过将大部分工作量从公共云转移到直接由Dropbox租赁和运营的「低成本定制基础设施」,他们在两年内节省了近7500万美元。毛利率从2015年的33%增长到了2017年的67%,他们指出,这「主要是由于我们的基础设施优化和营收的增加。」
2018 年 2 月提交的 Dropbox S-1
但这只是 Dropbox。如果将这一节约潜力泛化到更多公司,云计算优化公司Optimyze的前谷歌工程师、联合创始人托马斯·杜林(Thomas Dullien)估计,每年1亿美元的公共云支出可以转化为大约不到这一总额一半的年拥有总成本(TCO,包括从服务器机架、不动产、冷却设备到网络和工程等成本)。
具体省下多少钱,因公司而异。不过,我们采访的几位专家都认同一个「公式」:「回迁」后的成本相当于云端运行等效工作量成本的三分之一到二分之一。此外,一家大型消费互联网公司的工程总监发现,公共云服务价格可能是公司运行自己数据中心成本的 10 到 12 倍。业内也有各种折扣方案可以将这个倍数降至个位数,比如,承诺使用的折扣方案通常会将费用下降30-50%。不过,即使有了这些折扣方案以及激进的研发预算,AWS的运营利润率仍在30%左右——这意味着「回迁」有望省下更多的钱。而且管理自己硬件所带来的性能提升可能会给公司带来更多收益。
在与所有不同从业者对话中,我们都可以发现这一规律:规模化运营公司所需的云计算成本,至少会让公司基础设施成本翻倍。
当您考虑云支出的绝对规模占总收入成本 (COR) 百分比时,节省下的 50% 成本就特别有意义。对上市软件公司(那些公开披露云基础设施支出的公司)进行基准测试后,我们发现,合同承诺支出平均为 COR 的 50%。通常,实际支出占 COR 的百分比甚至要高于承诺支出:一家价值 10 亿美元的私有软件公司告诉我们,他们的公共云支出占 COR 的 81%,并且「云支出占收入成本的 75% 到 80%,这在软件公司中很常见」。
在谷歌和Optimyze任职期间,Dullien观察到由于担心开销过大,公司在提交工作量时通常比较保守,只承诺基线工作量。根据经验,承诺支出通常比实际支出要低20%……我们采访的一些公司报告说,他们的实际支出至少超出之前预测的 2 倍。
如果将这一结论推广到所有采用公共云的软件公司,我们粗略估计,50家最大上市软件公司云计算账单总计达80亿美元(他们的年报也一定程度披露了云支出情况)。虽然一些公司采用混合方法——公共云和本地部署(这意味着,相对于我们的基准,云支出在COR占比可能更低),我们的分析也可以平衡这一点,只要假设承诺支出等于实际支出。根据我们与专家的对话,假设「回迁」使云支出减少 50%,这意味着总计40亿美元的成本回收。而对于那些更广泛采用云基础设施的上市软件公司和消费互联网公司来说,这个数字可能要高得多。
公司 S-1 和 10K 文件;来自 a16z分析
40亿美元(的成本回收)这个数字本身就令人震惊,但当换算成未解锁的市值时,数字会更令人大开眼界。由于所有公司在概念上都是以其未来现金流的现值来衡量的,因此,实现这一总额(40亿美元的成本回收)所创造的市值增量将远超40亿美元。
是多少呢?一个粗略的指标是,看看市场如何评估额外毛利:仍在烧钱的高增长软件公司估值往往基于毛利的倍数,这反映出市场对公司长期增长和利润率结构的假设。(通常引用的收入倍数也反映了一家公司的长期利润率,这也是为什么即使在增长率调整的基础上,毛利率较高的业务,收入倍数也往往会增加)。然而,这两种资本化倍数都可以作为估计公司未来现金流量的市场贴现的一种启发式方法。
在我们分析的50家上市软件公司中,平均企业总市值相当于2021年毛利的倍数(基于上市时的CapIQ),也就是24-25X。换句话说:每节省1美元(或者说,毛利每增加1美元),市值会增长24-25倍。
这意味着,仅在这50家公司中,额外40亿美元毛利润就能额外产生1000亿美元的市值增量。此外,由于使用毛利润倍数(相对于自由现金流倍数),它假定了增量的毛利润也与某些递增的经营支出相关联,因此这种方法可能低估了每年节省40亿美元对市值的影响。
对于一家特定公司来说,这种影响可能会更高,这取决于公司的具体估值。为了说明这一现象,我们以服务公司Datadog的基础设施监控为例。上市时,该公司交易价格接近2021年40倍预估毛利润,并在S-1中披露了总计2.25亿美元的三年承诺支出(AWS),折合每年7500万美元。假设其中的50%(也就是3750万美元)可能通过回迁得以收回,那么,仅就承诺支出削减而言,就获得了15亿美元的市值!
这样的粗略分析从来都不完美,不过,方向是明确的:大型上市软件公司的市值受到云计算成本和数千亿美元的拖累。如果把范围扩大到企业软件和消费互联网公司,这个数字可能超过5000亿美元——假设总体云支出的50%是由规模技术公司消费的,这些公司有望从回迁中获益。
对于商业领袖、行业分析师和建设者来说,云服务成本太贵,以至于在做出长期甚至近期的基础设施决策时,很难忽视其对市值的影响。
截至 2021 年 5 月的 CapIQ;此处的图表仅供参考,不应作为做出任何投资决定的依据。
我们将何去何从?一方面,开始将工作量从云上回迁是一个重大决定。对于那些事先没有计划的人来说,必要的重写似乎是不切实际的,也是不可能的;任何此类工作都需要一个强大的基础设施团队,而这个团队可能还没有到位。所有这些都需要在核心业务之外建立专业知识,不仅会分散注意力,也会影响公司增长。即使从规模上看,云也保留了它的许多优点——比如按需容量,以及支持新项目和新地区的大量现有服务。
但在另一方面,我们也在文章中概述了这种现象,即当云计算成本在某种程度上「占上风」时,数千亿美元市值就会被抑制,并陷入一种悖论:如果不开始使用云计算,那你就是疯了;如果坚持使用云计算,你也是疯了。
那么,公司可以做些什么来摆脱这个悖论呢?如前所述,我们不会以任何方式提出「回迁」的理由;相反,我们指出,基础设施支出应该是一个一流指标。这是什么意思呢?公司需要尽早,经常或有时进行云外优化。当你要建立一家大规模公司时,基本上就要告别任何教条主义。
虽然这里有更多关于思维转变和最佳实践的内容要讲——特别是当(云对公司周期影响的)全貌最近才出现的时候——但是,下面这些注意事项可能有助于公司应对不断膨胀的云成本。
将云支出纳入 KPI。使基础设施成为一流指标的一部分,就要确保它是业务的关键性能指标。以Spotify的成本洞察(Cost Insights)为例,这是一个跟踪云支出的工具。通过跟踪云支出,公司工程师(而不仅仅是财务团队)能够掌控云支出。
本·沙克特(Ben Schaechter)曾在Digital Ocean工作,现在是Vantage公司的联合创始人兼首席执行官。他观察到,他们不仅看到整个行业公司在业务生命周期早期就将云成本指标与核心性能和可靠性指标放在一起,同时,「被意外的云计算账单困扰的开发人员变得越来越精明,并期望他们的团队在云计算支出方面更加严格。」
激励正确行为。向工程师提供有关基础设施的一流kpi数据,只会让他们意识到问题的存在,却不会激励他们改变做事的方式。一位著名的业内 CTO 告诉我们,他的一家公司采用了类似于销售中使用那些 (SPIFF) 短期激励措施,任何通过优化或关闭工作量来节省一定数量云支出的工程师都会获得一点奖金(持续不断的节省,也给公司带来高的投资回报率)。
他补充说,实际上,这种方法——基本上「将痛点直接与能够解决问题的人联系起来」——成本更低,因为它在短短6个月内就给整个组织带来了 10% 的回报。值得注意的是,公司首席财务官是认可这种非传统模式的关键。
优化,优化,优化(重要的事情说三遍)。在评估任何企业的价值时,最重要因素之一是销售成本或 COGS——每赚 1 美元的成本支出是多少?客户数据平台公司Segment最近分享了他们如何通过增量优化基础设施决策,将基础设施成本降低了30% (与此同时,同期流量增加了 25%)。有许多第三方优化工具可以为现有系统提供快速增益,根据我们的经验,范围在10-40%之间。
提前考虑「回迁」。仅仅因为存在「云悖论」——云在早期更便宜、更好,但在公司发展后期成本更高——并不意味着公司必须在没有计划的情况下被动接受它。确保你的系统架构师及早意识到回迁可能性,因为当云成本开始赶上甚至超过收入增长时,就太晚了。即使早期进行适度或更模块化的架构投资——包括能将工作量转移到最佳位置而不被特定云锁定——也会减少将来将回迁所需的工作量。Kubernetes的流行和使工作量更便携的软件容器化,一定程度上也反应出公司不希望被锁定在特定云。
渐进式「回迁」。「回迁」(如果这确实对您的业务来说是正确的举措)没有理由不能以混合方式逐步完成。除了非此即彼的讨论之外,我们还需要更多细微差别:例如,「回迁」可能只对资源最密集的工作量的一部分有意义。不一定非此即彼!事实上,在我们采访过的许多公司中,即使是最积极回迁工作量的公司仍然在云中保留了 10% 到 30% 或更多的(工作量)。
行业是如何走到这一步的,很容易理解:云是优化创新、敏捷性和增长的完美平台。在一个由私人资本推动的行业中,利润率通常是次要问题。这就是新项目倾向于从云中开始的原因,因为公司优先考虑功能开发速度而不是效率。
但是现在,我们知道了上云带来的长期影响尚未得到很好的理解——这很有讽刺意味,超过 60% 的公司首先将节约成本作为迁移到云的原因!对新的初创公司或新项目,云是显而易见的选择。而且,为云提供的灵活性支付适度的「灵活性税」当然是值得的。
问题在于,许多情况下,对于大公司——包括规模化的初创公司来说,这笔「灵活性税」相当于数千亿美元的股权价值,而且公司往往「深陷」云计算,难以自拔。有趣的是,提前迁移云的最常被引用的原因之一——大量的前期资本支出 (CapEx)——不再需要。过去几年,公共云基础架构的替代方案已经发生显著变化,可以完全通过运营费用 (OpEx) 而不是资本支出(CapEx)来加以构建、部署和管理。
另外,需要注意的是,尽管这里分享的一些数字看起来很大,但我们的假设实际上还是偏于保守。通常,实际支出会高于承诺支出,而且我们还没有考虑超额的弹性定价。因此,云成本对全行业市值的实际拖累情况可能远高于预期。
目前坐拥30%利润的云供应商最终会通过竞争而降低(前述)问题的严重性吗?不太可能。因为目前大部分云支出都被三家寡头垄断,亚马逊、谷歌和微软三家公司总市值高达5万亿美元。有点戏剧化讽刺的是,虽然他们也受到了竞争的冲击,但是仍然拥有较高的利润率,而较高利润率部分来自他们运营着自己基础设施,在提振公司股价的同时,还能对产品和人才进行更大的再投资。
因此,在数千亿美元的情况下,这个悖论可能会以某种方式解决:公共云要么开始放弃利润,要么开始接受工作量的下降。无论哪种情况,现在基础设施中最大机会可能介于两者之间:云硬件,以及运行其上未经优化的代码。
https://a16z.com/2021/05/27/cost-of-cloud-paradox-market-cap-cloud-lifecycle-scale-growth-repatriation-optimization/