作者:王与桐、小希
编辑:石亚琼
**
2016年3月5日,北京天气晴。上午10点,在一间长十米,宽三米的屋子里,几个身穿格子衫的程序员,开始对着一面白板交流。
这是PingCAP第一次 Infra Meetup。这几个人中,有近10个来自PingCAP的创始团队,唯二的客人,分别是来自华为和京东的开源爱好者。主人比客人多,倒也可以理解,毕竟周六上午的正确打开方式应该是“补觉”。
如今,以交流国内外基础架构技术为主题的Infra Meetup,已经举行了一百三十多期。PingCAP也成为今天成为中国最大的开源社区之一。作为底层软件的公司,PingCAP独立研发的数据库产品TiDB,在 GitHub (世界上流行的开源代码托管平台)共计获得超过 25000的标星,集合了近 1200位贡献者(Contributors);在世界范围内,TiDB也是基础架构领域的知名开源项目。
但创始团队的野心却远不止于此,CEO刘奇说:“我们还是要专注TiDB这一款产品,希望可以做到 500 亿美元的市值,而这背后需要 10 亿美元量级的营收支持。”
500亿美元市值是什么概念?Oracle市值1700亿美元,Snowflake市值700亿美元。如果要要做到500亿市值,需要10亿美元量级的营收支持。如何去做营收呢?
对于开源软件,所有人都关心的首要问题就是:免费的开源产品,能赚到钱吗?
先说答案:能。
目前,PingCAP已经是中国开源软件领域营收最高的公司,公司已经有超过 1500 家用户将 TiDB 用于线上生产环境,国内的客单价在百万元量级,国外更是数倍之高。
中国的开源仍在发展的早期阶段,大部分开源厂商尚未开始进行商业化尝试。PingCAP的商业化跑通让更多的国内的开源公司获得了更快速的发展。在开源领域,头部美元基金也在积极布局,比如经纬在近几年也投资了PingCAP、Nebula等很多开源公司。
PingCAP在产品研发前两年也没有营收,但是在开启商业化后,PingCAP已经有过百家付费客户,营收增速平均保持在 300%。PingCAP告诉36氪,低获客成本、高留存、高增购、比传统软件公司强大的销售效率以及产品化迭代的加速度,是PingCAP保持高速增长的重要原因。
大多数商业开源软件的商业化途径是:首先提供免费版本软件,后期再对高级功能或服务收费。源代码可供所有人查看和使用,因此许多潜在客户的开发人员也会基于开源产品做项目,使核心产品更有用、更有价值。这也是开源模式最大的优势,也因此在被采用时遇到的阻力很小。
但其难点也很明显:开源软件可能需要数年时间才能开发成功;开源软件口碑比传统的市场营销手段重要,因此,收集关于迭代产品的反馈需要花费一定时间;开源用户和付费用户之间的鸿沟非常大,毕竟从“向所有人开放的免费协作项目”到“只向付费用户开放的商业产品”并不容易。
因此,开源软件获取商业客户信任的最佳方式是完全透明,提前规划功能,并在社区探讨。总结而言,就是借力“开源社区”,做到开源项目和社区的高度匹配。
那么开源商业化,在付费意愿更低、数字化意识薄弱的中国是如何实现的?
与国外模式对比,PingCAP也具备基于开源社区进行传播,和明确付费、免费功能的两大优势。
首先,PingCAP 基于开源社区,可以实现一传十、十传百的获客。
开源天然有着与toC一样的的病毒式传播能力,在工程师社区里,用的不爽的工程师会反馈并提供解决方式;产品质量越好,推广人越多,问题解决越快,正向循环就越快。这比传统软件通过销售挨家挨户的敲门方式相比,效率高出太多。
再来看PingCAP是如何明确免费功能和付费功能的。
与红帽等第一代开源软件以支持服务为主的商业模式不同,PingCAP属于三代产品,除了服务、Hybrid-Licensing的同时,也可以按照SaaS模式付费。
软件获客方式流程分为几步:听说-研究-测试-上线-维护,开源就是漏斗的源头。
开源是商业化的漏斗的源头,图片来源:A16Z
而在这一漏斗中,又天然包含了开源相比传统SaaS的优势:获客效率高、成本低。
第一,在“听说”阶段,开源就因为能够看到源代码,能更容易获得信任。
第二,在“研究”阶段,客户在采用传统SaaS服务时,需要对比和选型,但开源产品的质量可以研究源代码,也有很多社区用户现成的测试报告作参考,节省客户和厂商双方的时间。
第三,客户“测试”、“上线”过程中遇到问题时,开源有很多开发人员可以提供帮助,但是在闭源的状态下,只能由厂商去解决。
第四,开源社区的模式,天然对“运维”阶段非常友好。
第一次付费在上线阶段发生,即购买TiDB的服务。在国内市场,选择在这一阶段就付费的公司往往是金融机构;少部分互联网公司也会在这一阶段付费,比如盖娅互娱、饿了么等。
另外,TiDB是标准的OLTP(联机事务处理)型数据库,承载的都是诸如银行核心系统等关键生产业务,这类关键业务需要极高的业务连续性要求(SLA),因此对原厂商业支持几乎是刚需,这也是PingCAP开源用户转化率和客单价双高的重要原因。
最后,PingCAP在中国土壤上的差异点是,找准了客户群:互联网企业和金融企业。
互联网企业是PingCAP的早期目标客户,一是因为早期开源爱好者往往都就职于互联网公司,二是因为TiDB存储、计算分离的架构设计,能够让用户按需扩容缩容,契合业务快速增长的互联网公司的业务需求。
PingCAP第一单付费客户也是互联网公司。2016年8月,游戏公司盖娅互娱向还没有商业化想法的PingCAP提出测试邀请。当时盖娅互娱有一个在线数据库系统,主要用于广告投放的分析,需要实时看到广告投放结果,随着业务的高速增长,系统已经达到瓶颈,迫切需要改造。
TiDB 的定位恰好能比较完美的解决这个痛点,只需要扩容,不必改造现有业务。但当时的TiDB还不够稳定,处在“能看”到“能用”的转化阶段,因此内部对于盖娅互娱的测试邀请比较慌张。“我们当时太不接地气了,连个中文说明书都没有。”刘奇回忆道。
真正上线也充满了波折。第一次上线时间是凌晨五点,但是并没有成功。盖娅互娱还不断鼓励PingCAP,让他们找到原因。隔了一天,TiDB又一次上线,跌跌撞撞终于成功了。
之后,互联网企业成为PingCAP的客户来源之一。2020 年 6 月,PingCAP 发布了 TiDB Cloud 产品,依托于公有云提供开箱即用的 TiDB 云数据库托管服务。借助于云,TiDB Cloud 可以通过水平扩展,拥有近乎无限的存储容量和计算能力,使用户可以专注在自身业务的快速增长。
比起收入,PingCAP 选择互联网行业切入的更重要的理由是:中国很多互联网公司的应用场景实际上非常有价值和挑战,很多场景都做到了全球第一,这是中国独有优势,在服务这些顶级的场景的过程中不断的打磨产品和业务共同成长。
选择金融行业的原因并不复杂,金融行业正处于数字化转型的关键窗口期,既有核心业务系统迁移改造等稳态场景的时间窗口,又有大量互联网业务等 TiDB 十分擅长的敏态场景,另外金融行业付费意愿较高。金融行业净利润占国内上市公司的70%,这也差不多是金融行业占PingCAP国内营收的比重。
当然,金融行业对于安全性、可用性的要求也更高。服务金融行业时难免会和阿里、华为等大厂短兵相接,但在刘奇看来,他们虽然综合能力强、业务线广,但在单点上面的投入或许并不大,此外,考虑到系统的中立性,大多数的CIO、CTO都不愿被单一大厂锁定。
因此,在拿下行业头部的标杆客户后,PingCAP的金融之路就会顺畅很多,目前已经服务了包括中国银行、光大银行、浦发银行、浙商银行、北京银行、微众银行、中国人寿、平安人寿、国泰君安、华泰证券、陆金所等数十家金融机构。
总结而言,PingCAP的开源商业化在中国得以实现,一是基于开源社区高效传播的优势,二是相对传统软件,效率高、成本低,更适应当下的场景需求,三是选对行业,通过互联网行业切入,高速打磨和迭代产品,找对时机然后辐射到其它行业。
知道了如何赚钱,下一步就是要明确能赚多少钱,即回答“最好的市场”的问题。
市场规模决定了公司的天花板,决定了公司能讲一个多大的故事,我们以数据库行业内市占率最高的Oracle为例。在PingCAP刚成立的2015年,Oracle在中国数据库市场的占有率高达56%,一骑绝尘。
Oracle最大的市场在美国。这也符合全球任何软件现状,Oracle也好,Salesforce也好,Snowflake也好,美国市场营收基本能占到全球营收的一半。
据了解,中国市场占Oracle全球总营收不到5%。这背后的逻辑是,中国市场对于数据库有着大量的需求,但同时,中国客户因为人力成本、付费习惯及付费能力方面的客观原因,并不能很好的支撑一个全球化数据库公司在商业上的的高速成长诉求。
另一方面,海外市场也在进一步增大。作为PingCAP最早及最大的机构投资人,经纬中国的合伙人熊飞认为,对于海外市场,云的普及也让给开源基础软件的商业化带来的新的思路,比起传统的软件售卖模式,在云上提供服务无疑是更高效的,由于云基础设施的高度的标准化和自动化,同时加上 Pay-as-you-go 这样对用户来说更友好的付费和租用模式, 对于数据库这类高度标准化的软件产品,依托于云的基础设施是获取规模化收入的重要途径。
在摩根士丹利的一份报告中,关系型数据库的市场将在2024年达到250亿美元,而PingCAP这种依托于公有云的新型关系型数据库,到2024年的份额将占到46%,比2019年上升19%。
也就是说,中国市场合适早期积累产品场景和方案需求,不断打磨技术和服务能力,海外市场适合在解决方案成熟后,用来盈利。
这也是PingCAP的策略。
经历了移动互联网和金融、物流各行各业的数字化转型的中国,已经培养了基础软件领域最丰富且具有挑战性的众多场景:美团是全球最大的外卖交易平台;四通一达是全球顶尖的物流公司;贝壳是全球最大的房屋交易平台……服务好他们,就代表着具备了服务同类海外公司的能力。
于是,从2019年服务Shopee开始,PingCAP走向了海外市场。目前海外市场的营收已经超过PingCAP国内营收,在不同的国家都有头部的客户,比如日本最大的在线支付公司 PayPay, 美国的Square,越南的独角兽VNG, 印度的 Zomato,东南亚最大的电商Shopee,法国最大的在线视频公司Dailymotion等等。
中国市场不够大固然是全球化的原因之一。另一方面,从最好的产品角度出发,好的产品就应该通行全球。所以PingCAP成立第一天,就把国际化当标配去做。
目前,PingCAP有来自 Google、Twitter、Square等公司,超过 300 的海外社区贡献者。公司通过参加CNCF组织的活动,以及发布前沿技术爆款文章在Hacker News、Dzone等媒体,吸引对TiDB感兴趣的技术大咖。最终,很多人会沉淀在一些职业社交平台,比如Slack或者社区里面的兴趣小组,孵化出一系列潜在的商机线索。
PingCAP海外的支持者分布,图片来源:PingCAP
开源商业化行得通的基础,还是产品。
在2015年,咨询公司Gartner预测,商业数据库市场容量到2021年将会衰减到220亿美元左右。快速发展的云技术和硬件技术,以及快速普及的开源数据库技术,将共同分裂商业数据库领域。
与此同时,学术界在分布式技术上也出现了一些突破性进展。这给在2015年开始创业的刘奇、黄东旭、崔秋三人提供了理论基础。
一款新型的数据库产品的研发周期注定很长,有耐心的资本可以帮PingCAP度过青黄不接的研发期。经纬中国合伙人熊飞在看了几年企业服务后,意识到基于底层架构的创业将是下一波浪潮。在经纬北京的4号会议室,甚至连BP是什么都不知道的刘奇带着东旭、崔秋,和熊飞聊了快三个小时。 熊飞很快做了投资的决定。
让用户简易地操作和使用数据库,是TiDB产品设计的核心理念。用户需求明确,想要一款自动弹性伸缩,能解决分库分表(为了解决由于数据量过大而导致性能降低的问题,将原来独立的数据库拆分成若干数据库)问题的数据库。
为了控制规模和复杂度,TiDB将计算、存储分层,一层是计算层SQL,它的特点是语言简洁,非计算机专业人的可用。另一层是存储的key-value层。
离用户越近越能更快得到用户的反馈,更快验证想法是否可行,因此,团队最终选择从SQL层开始的顺序。
如何替换原先的数据库也是一个巨大的挑战。用户习惯具有惯性,切换时也有各种要素考虑。2016年,单机版的MySQL仍然是主流,团队在调研后发现,用户不敢马上切换到新的产品,是担心数据丢失等问题发生。
在不断迭代中,TiDB也明确了自己的切入点:把分布式理论和传统关系数据库相融合,兼容MySQL 协议和生态,应用无需或者修改少量,即可从MySQL 迁移到TiDB。
不过PingCAP并不满足于在小数据量下取代MySQL,服务数据大规模增长的企业,才是新型分布式数据相比于单机MySQL的最大变革。TiDB 存储、计算分离的架构的设计,让用户可按需对计算、存储分别进行在线扩容或者缩容,并且让整个过程中对应用运维人员透明。
两年后,TiDB才推向市场,开始商业化。正如前文所说,TiDB早期的两个标杆客户饿了么和摩拜的痛点也都是业务在狂飙,但数据库扩展与运维跟不上,而通过灵活的增减节点,TiDB帮助客户实现业务大规模增长下,数据库的性能提升和平稳升级。
挑战完“大家伙”,TiDB也积累了丰富的场景经验,像伴鱼这样新一代的客户则选择All in TiDB,不仅能够解决痛点,也节约了人力。传统企业中,每条业务线底层都需要一组人力去做支撑,目前基于 TiDB 构建的数据底层,伴鱼仅一套支撑服务团队,就支撑了全公四条司产品、业务线,提高了业务研发和 DBA 的工作效率,降低了将近 75% 的人力开销成本。
随着产品、商业模式、市场的答案逐步明晰,资本对于PingCAP也越来越看好:PingCAP于2015 年获得经纬中国领投的天使轮融资;之后每年都会有新的资本重注;2020年11月17日,PingCAP完成 2.7 亿美元的 D 轮融资,由GGV Capital、Access Technology Ventures、晨曦投资、时代资本、五源资本(原晨兴资本)共同领投,老股东经纬中国、云启资本继续加持。
这点陪伴PingCAP成长的投资人看在眼里,经纬中国的创始管理合伙人张颖也经常提醒公司:要注意现金流、要变现、要坚持探索商业化;刘奇本人则觉得PingCAP不够接地气,所以在商业化方面,他一定要补齐相关的销售人才来弥补自己的短板。
站在此刻看PingCAP的五年,产品、商业模式、市场、资本的补齐,都离不开一个关键词——开源。
可以说,“开源”是PingCAP 走到现在的源动力。
与开源精神类似的事务并不少见。在特定范围内,开源软件的源代码任何人都可以审查、修改和增强,类似于全人类都可以编辑的百科全书Wikipedia。一个开源项目,无论是阿里、美团,全球任何一家企业的工程师,都可以去参与研发,提交代码,并且使用共同研发的产品。
另一个对开源的著名类比就是集市的模式。在开源著作《大教堂和集市》中,IT界传奇人物Eric Raymond表示,世界上的建筑可以分两种:开源软件是集市,天天开放在那里,从无到有,从小到大;传统软件则是大教堂,需要几代人呕心沥血才能建成并投入使用。
这样类比原因是,集市模式让更多的工程师参与到软件的开发过程,提高软件质量,完善自身产品并支持自己的服务。
保持开源社区的活力是TiDB变得更好用的关键,也是实现正向产品循环、商业循环的关键。目前,TiDB实际参与的贡献者已经近 1200人,通过社区杠杆去撬动优秀人才是开源力量的强大之处。
而如何运营开源社区?PingCAP有一套自己的方法论,刘奇认为就像运营抖音、知乎等内容社区一样。
第一,先要找到最有能力的贡献者形成产品原型,逐渐的细化分工,最终形成加速的循环。
在最开始两年,TiDB并不是一个拿来即用的状态,PingCAP自身团队会对某一模块有一些构思,然后通过周六早上的Infra MeetuP 把TiDB社区里对开源最忠诚、最狂热的几个专家集合起来打磨产品,形成一个产品“毛坯”。
随着贡献者越来越多,分工也会更细致,也会让模块的搭建速度也越来越快。当产品开始进入企业应用,就可以从企业收集到更多反馈,从而迭代改进产品,这就进入了一个大循环。在2018年到2019年,大循环完全启动后,迭代速度也越来越快。“我们真正高速跑起来不过两年。”刘奇认为,这就是开源社区厚积薄发的体现。
第二,设置反馈和激励机制,让每一位贡献者感受到尊重和认同的同时,传播社区的能量。
TiDB社区将贡献者分为几个等级:Contributor—Committer—Maitainer,就像升级打怪一样获得成就认证勋章。 很多社区贡献者的代码大多是基于侠义精神的分享,不是每个人都能得到金钱上的回报。举个例子:有些开发者,他们追求的是极客精神和完美主义,在使用开源产品时,会主动的去改进 BUG 或者增加新的功能;有些是希望通过分享、帮助别人,从而获得成就感。
PingCAP还会设计一些非常有趣的周边来证明身份,比如标志性的红色马克杯就必须是贡献者才能有。发放标准非常严格,PingCAP的A轮领投方云启资本董事总经理陈昱,也在TiDB上贡献过一些代码,拿到了红色马克杯。
第三,定期举办有技术影响力和深入用户的活动。
疫情前,线下Hackathon是PingCAP会定期举办的活动。在Hackathon期间,工程师会进入到疯狂Hack-吃饭-疯狂Hack-吃饭的模式中写代码到凌晨。
开源活动中,图片来源:PingCAP
另一件震动技术圈的大事,就是48小时写一本关于TiDB的技术书籍,一本涵盖TiDB架构原理、最佳实践案例、生态发展的作品诞生,两天内总计产生421次Commit,199个PR。
这些听起来疯狂的举动,其实并不难理解。回到本文开头的场景,PingCAP通过筛选到了一批开源狂热爱好者,在回馈社区的同时,也形成了 PingCAP的人才护城河。
而最根本的根本,是要回答一个问题:开源为什么会被追捧?
企业软件行业的发家基础,是平台与开发者。而开源软件天然对开发者友好:全球有数千万开发者使用开源平台访问代码、修补应用程序、促成项目、参与社区。
图片来源A16Z
就像硅谷风投A16Z说得那样,开源吞噬一切。上图所统计的是1988~2018年开源领域的融资数量及融资规模:200 家把开源作为核心技术的公司,总体融资规模超过 100 亿美元,且近十年来融资数额越来越大。
未来,开源项目将只增不减。开源不再只是 RedHat、Elastic、Databricks 与 Cloudera,它还将是 Facebook、Airbnb、Google 以及其他任何以开源为核心技术栈的商业公司。开源软件的市场及其可能性,要远远超过目前的想象。
希望纵然存在,但问题也很现实:开源社区的商业化在不同领域可不可复制?市场的天花板在哪里?这个市场可以容纳几家相似的公司?Snowflake至今还在亏损,那这类公司到底何时才能盈利?虽然基于公有云的关系型数据库发展极快(2024将占到46%的份额),但是中国企业云化进程滞后,这是否会影响相关企业的增速?
时间将给出答案。