BI PaaS 如何赋能伙伴成为“垂直 BI 厂商”
导读
近期,衡石成功举办了 HENGSHI SENSE 4.2 新版本发布线上分享会,分享会上衡石 CEO 刘诚忠及衡石首席数据科学家陈家耀围绕整个数据分析产业的发展、行业趋势和衡石的创新进行深度探讨和分享。本期推文我们就先来看看衡石 CEO 刘诚忠带来的《Powered by BI PaaS - 让商业分析即刻上线》分享。
为赋能伙伴而生的 BI PaaS
衡石近期发布了 4.2 新版本,此次发版更加明确提出了 BI PaaS 的定位,这也是业内极具差异化创新的产品形态。实际上在今年 4.0 版本发布后,这个定位已经陆续在衡石与目前数百家 SaaS 和软件 ISV 伙伴的合作中得到验证。
数据分析产业的核心矛盾
下图呈现的是经典的数据分析和 BI 架构,数据通常通过 ETL 到达数仓,做完各种建模和转换,再通过 BI 工具进行报表分析。但当前的趋势是,商务运营端介入到数据分析的阶段会越来越深入,这就对数据分析的灵活性提出了高要求。这与 BI 经典架构存在很大的矛盾。
数据分析产业的核心目标
企业遭遇的挑战是如何真正降低业务人员的分析门槛。其中有两个比较核心的点。一是业务人员通常不具备 IT 背景,这就要求 BI 产品必须对业务人员使用友好,需要适配运营的灵活性,更加贴合业务的场景化分析;二是在云端和大数据的发展下,数据环境和来源更加多样,数据底层越来越复杂。所以在数据分析中,既要搞定底层数据的环境复杂性又不能影响到对业务的友好性,这是两个很高的挑战,并且相互矛盾。从中美的企业服务市场来看,两边在如何应对挑战的路径上有很大的差异性。
美国是通过工具的生态分层来应对这个核心挑战。首先在 BI 可视化层面,这些 BI 工具越来越倾向于对业务友好、自助分析、开箱即用的形态;在中间层,类似 Looker、DBT、Transform 等语义层、数据管道、指标集市工具互相配合,补充运营能力的短板,让业务人员能进入到分析过程中;在基础框架层,美国的 BI 厂商基于 Snowflake、Databricks 等新一代云原生的数据基础设施来屏蔽数据环境的复杂性,也大幅降低了运算成本。
但在国内,一方面缺乏成熟完善的云原生数仓生态,这意味着作为分析平台的厂商,经常需要自己去应对这方面的要求;另一方面,国内还没有足够丰富的产品生态互相打配合,中国的企服市场还是一个以解决方案为主流的市场,工具厂商的生态还没有发展起来 ,当然近五年来已经大有进步了。
这意味着衡石在当下服务客户需要构建端到端的产品,覆盖全栈的分析管道,才能同时应对这两个层面的要求:既对业务足够友好,又能应对数据环境的复杂性。另外对运营和指标的重视,也需要体现在产品的进化中,因此在国内做这个事情其实是面临比在美国更大挑战。
HENGSHI SENSE BI PaaS 架构的形成
在数年的产品打磨中,衡石始终围绕“做专业伙伴的 BI 引擎”进行产品研发和迭代,HENGSHI SENSE 最终形成如上图呈现的一站式架构:从数据的多源异构,到中间虚拟湖仓(湖仓一体的管理框架),再到语义建模层,最后到可规模化的数据服务,BI 是数据服务中的一种。
首先,衡石通过自研具有强大表达能力的分析语义层,实现 ELT+Embed 的现代分析架构,将分析与数据解耦,规避经典 BI 架构中业务人员过于依赖 ETL 数仓的问题,降低 ETL 的工作量。当然,HENGSHI SENSE 并没有抛弃传统的 ETL,而是 ETL 和 ELT 相结合,这种模式最大的创新在于能够让业务人员真正参与到分析过程中,满足业务对于分析灵活性的要求。
其次,由于国内没有成熟的如 Snowflake 这样的框架性产品,衡石重度投入创新架构 in-datalake(内置虚拟湖仓)的研发,对应用层面呈现完整的数仓能力,屏蔽底层复杂的数据环境,多源异构的数据也能够在 HENGSHI SENSE 中轻松整合,并且能够实时同步和加速,弹性应对计算的算力要求。此外,衡石科技与国内优秀的新一代云数仓厂商一直保持深度的产研合作,后期会适配引入各种云原生的数仓能力。
第三,对指标的高度重视是全球分析的主流趋势,衡石自研了中心化的指标管理模块,在 BI 工具的形态之外对外呈现指标中台的形态,让运营人员得到充分发挥,这个其实是整个 BI 产业对互联网大厂的敏捷指标以及相关的运营方法论的一次集中学习。
最后,HENGSHI SENSE 是一个端到端架构,通过这样的架构把 PaaS 级平台与各行业 SaaS/ISV 产品结合,让数据分析在各垂直场景高效落地。衡石只专注于提供数据能力,拥有行业 know-how 的 SaaS/ISV 厂商基于 HENGSHI SENSE,搭建出贴合业务的应用场景方案。
这种合作模式,最终让客户在业务场景中可以快速直接的开展探索,对于 SaaS/ISV 伙伴来说节省巨大的研发成本,也节省大量的开发周期,对于衡石来说可以专注于做好通用的标准化产品。这是一个边界清晰且多方共赢的新型供给关系,也改变了整个数据分析的场景体验,有利于推动数据分析和 BI 快速普及到各种行业,帮助客户加速数字化转型的进程。
Powered by HENGSHI BI PaaS
数据分析是行业 Know-How 高度相关的业务领域高级工作。衡石一直秉承一个明确的“Powered by HENGSHI ”的合作理念,让行业的归行业,数据的归数据,赋能每一家 SaaS 和 ISV 厂商都能成为“垂直 BI 厂商”,成为专业领域内的“分析场景”解决方案提供商。
如何定义 BI PaaS ?
PaaS 层产品是多个能力的组合,在某个领域内不需要开发去应对个性化的需求。HENGSHI SENSE BI PaaS 是一个在数据分析和 BI 应用的全栈数据能力组合,主要包含了:
-
数据多源的适配和运算下推。在4.2的版本中,不管是 Mongo 的原生语法、Clickhouse 的物化视图,还是部分 SaaS 应用 API,HENGSHI SENSE 都做了适配
-
数据归集的 datalake 能力,能够满足多源数据的汇聚、聚合和加速。HENGSHI SENSE 本身能够提供一定程度的 datalake 能力,同时还跟国内外一些数据湖、云厂商紧密结合,并在 PaaS 层进行引擎自由选择配置
-
数据准备、数据科学、任务调度的数仓能力,HENGSHI SENSE 能够完成数仓的常规建模处理任务
-
承载计算的多引擎适配能力,并且足够的封装和透明。HENGSHI SENSE 兼容各种各样的引擎,包括 Hadoop,Hive,Impala,Doris,Clickhouse 等高性能引擎,默认配置好一些客户常用的引擎,平台用户只需要进行配置调用即可
-
指标的中心化管理的中台能力
-
标准的语义层和在全数据源范围内的翻译执行
-
丰富交互操作的可视化仪表盘
-
社交和协作、强大的发布和嵌入,API 的完整管理能力
-
企业级支持:用户/租户管理、单点登录认证、权限管理、弹性扩展、集群管理等
HENGSHI SENSE 对于伙伴而言,就是这一组可被自由调用的正交的能力,也就是我们定义的“BI PaaS”。伙伴基于这种能力,结合其对行业的理解,可以极低的研发投入把分析场景做出来,并且轻松地根据客户需求变化随需而变。
从“自助式”分析到“自主式”分析,衡石与伙伴共享场景化分析普及的蓝海增长
衡石与 SaaS/ISV 厂商的合作,能够陪伴伙伴完成数据分析完整的成熟路径。从服务能力看,会从标准分析模板的构建,到个性化报表分析、再到终端客户业务侧的自助分析,最后到终端客户分析师的专业分析,逐步完成从数字化转型到数据驱动的过程。
衡石和伙伴的联手,大大降低了数据分析的门槛。一方面,由于客户的数据更多来自于标准的 SaaS API 接口,对客户来说数据准备的工作量大大降低;另一方面,客户需要在特定的场景下关注业务效果、关注 KPI,所以分析是在明确的场景下进行探索的,这是相对有限域的范围,而不是一个完全开放的域,分析也会因为有明确的目的性易于检验。
这些有利条件都进一步推动了终端客户的个性化分析和自助分析成为必然趋势。我们深深的意识到,有效的分析最终只能来自于行业专家们的深刻洞见,衡石提供相对成熟的企业级工具平台,是为了让那些洞悉行业本质、深度服务客户的产品厂商不再受困于研发投入的泥潭风险,充分发挥自己的业务优势,从专业的行业应用服务商提升为更专业的数据智能服务商。