图数据库是互联网时代下专门用来处理海量关联网络的基础设施,以社交网络和支付网络为代表,后台数据关系复杂化使得图分析方式成为目前处理数据的优选。
根据 Gartner 研究报告,2019~2022年,图数据库市场将会以每年 100% 的增长率增长;而在过去的 2018 年,图数据库市场大概是 5 亿美元,到 2022 年保守估计至少 80 亿美元。
从技术路线上看,图数据库分为单机版和分布式。单机版本以 Neo4j 为代表,目前市场应用虽广但是已经难以满足日益增长的数据需求,且使用成本高;分布式图数据库中,目前纯粹的分布式图数据库成为市场发展趋势,因为其容错性强、可以快速扩容缩容、支持线上查询。
杭州欧若数网科技有限公司作为一家研发纯粹分布式图数据库的公司,成立于 2018 年 10 月。其分布式图数据产品 NebulaGraph 除了高可用、还实现了开源,并且技术设计上正在为上云做准备。
NebulaGraph 高可用主要体现在能够支持海量数据存储。拥有千亿节点、万亿条边,数据总量可达 100 TB(目前业界唯一),支持在线水平扩展,同时提供数据一致性保障。
开源的图数据库。公司 CEO Sherman Ye 认为,开源已经是主流程的软件开发方式。公司通过开源社区吸引更多的爱好者,并转化为线下的服务。这与订阅式相比,更容易获得客户关注,尤其是付费能力有限的中小型企业。
存储、计算分离的设计架构符合上云趋势。目前欧美国家数字化进度较快,很多企业自身数据已经上云,所以也会要求图数据库上云。上云之后将方便数据的存储、调取,这是图数据库的未来趋势。
从全球市场上看,图数据库在海外市场发展火热,而在“云”化的方向上,各家采取的方法略有不同。
以 AWS 和微软为例,AWS 提供了多种不同类型的云数据库产品供用户选择,比如:关系型数据库(Aurora / RDS)、数据仓库(Redshift)、内存数据库(ElastiCache)、图型数据库(Neptune)和 NoSQL(DynamoDB); 而微软则恰好相反,Cosmos DB 采取“一刀切”的方式,号称可以适用一切通用型数据库,当然也包括图数据库。国内图数据库市场则处于更早期阶段,目前是以百度、阿里为首的互联网巨头针对企业内部环境开发了图数据库产品。
36氪之前采访过 TigerGraph,也是将图数据库与云结合,并且在 2018 年初正式进入中国市场;另一家费马公司,则是主打线下查询的图数据库,技术路线不同。
Nebula Graph 接触到的客户主要在互联网银行及社交领域。团队目前 30 人,创始人 Sherman Ye 曾就职于 Facebook ,参与和领导了搜索引擎、图索引引擎等分布式系统的设计和开发,这是他所研发的第一代图数据库;2015 年回国后加入蚂蚁金服,担任蚂蚁金服图计算及存储技术团队负责人,主导研发了他的第二代图数据库。