分析型数据库( Analytical Processing Database)主要用于对海量数据进行存储和分析计算。目前传统的分析型数据库以Teradata(美国)、Oracle(美国)、Greenplum(美国)为代表,长期在国内占有70%以上的市场份额。然而,随着大数据、人工智能等新技术的发展,企业要面对爆发式的数据量以及更复杂的处理需求,而传统的分析型数据库又存在成本和处理能力的限制。基于该市场痛点,聚云位智打造了纯国产化的分析型数据库,使产品不仅具备传统分析型数据库的功能,还提升了数据处理能力,大幅降低了单位数据处理成本,从而满足人工智能时代对于数据处理的需求。
聚云位智成立于2013年5月,是一家企业级数据仓库技术服务商,面向军工、交通、电信、金融等领域提供分析型数据库(Linkoop DB)及解决方案。
LINKOOP DB产品架构
在数据处理量方面,Linkoop DB(以下简称LDB)比传统分析型数据库(Oracle、Teradata、Greenplum)更容易实现PB级的批量数据处理能力;同时LDB具备的高可扩展特性可以保证数据分布式存储和计算的水平扩展性,相对于主流开源解决方案具备十倍以上的数据访问性能提升。
LDB在数据处理的时效性和易用性上具有突出优势,这不仅能够帮助企业实现更多、更复杂的数据处理,还能够降低应用开发门槛,具体体现在:
传统的分析型数据库由于成本和技术架构的限制,只能做到对于批量数据的延时性处理,典型的场景如T+1的报表应用,而LDB采用的批流一体化优化技术,不仅在批量数据处理能力上提高了40%的性能(TPC-DS标准测试),还实现了毫秒级的实时数据处理速度,可以用于支撑实时业务场景的分析应用,如在线数据分析与实时事件检测等。
在易用性上,LDB采用标准SQL语言并扩展了流数据处理(SQL Stream)和AI计算(SQL AI)的语法,是目前国内唯一对批量数据处理、流数据处理和AI计算提供统一SQL接口的分析型数据库。因此,产品可实现单一SQL接口支持混合应用,不改变上下游开发人员使用方式,使代码的可读性更强,应用开发速度更快。
此外,LDB还增加了面向人工智能应用的数据处理场景。公司首席科学家陈冠华博士表示,目前国内人工智能行业还处在起步阶段,很多人工智能应用的数据管理手段还处在原始状态,极大影响了企业级应用的落地进程。LDB具有结构化数据和非结构化数据统一的管理能力,以及面向 AI 计算的分布式执行引擎。通过多层调度和多阶段增量优化技术使得批、流和 AI 任务以及混合任务得到最佳的优化,提高了资源的使用效率。例如,公司完成了某大型国际机场的人工智能落地项目,通过集成机场历史运营数据和各业务系统的实时数据并进行数据建模,实时预测未来大面积航延发生的可能性,预估航班延误对机场整体运营效率和保障资源的影响,据此推荐匹配的应急处置预案,使得大面积航延预测可达到秒级响应,预测准确率达到90%以上。
公司提供通用性的数据库产品,并与上下游企业合作为客户定制解决方案。目前公司主要通过直销及渠道等方式获得了了50-60家客户,客单价在150-200万元,以License+服务费的方式收费,公司未来将重点开拓销售市场。公司首席科学家陈冠华博士表示,数据处理的效果取决于三点:数据质量、使用的模型和算法,计算能力。前两点需要企业自身对数据和业务知识的积累,在此基础上通过数据库提供的数据管理和计算能力,实现高效的数据处理和高价值的数据应用,因此,行业间的配合至关重要。
公司创始团队来自北京大学,团队均有十多年在微软、Teradata等头部企业从事数据库的研发经验。公司在前期专注于技术积累,直到近三年才开始推出产品,并在近日的钱塘之星·2019(第四届)创业创新大赛上获得冠军。