热门资讯> 数据准备工作使数据可信,Datablau要帮企业自动搞定 >

数据准备工作使数据可信,Datablau要帮企业自动搞定

转载时间:2021.06.15(原文发布时间:2017.04.14)
244
转载作者:36氪企服点评小编
阅读次数:244次

数据作为企业的一项重要资产越来越被重视,而在对数据进行分析之前,需要做大量的数据抽取、处理、整合工作。这个准备工作是个脏活累活,却非常关键,只有做好数据准备工作,后面的数据分析才能产生真正的商业价值。

上规模的企业往往有上百个业务系统、数据库,以及成千上万份表单,数据环境十分复杂。不同IT厂商的数据技术、设计思路不同,导致每个数据集独立存在,无法互通。以前,企业关注的主要是业务,只要系统稳定不宕机就行了。而大数据时代,数据只有流通、碰撞才能产生价值。企业如果想进行数据关联性分析,需要业务人员和IT人员一起,根据需求对数据进行对应、分类,并编写脚本进行提取和关联。如果沟通不畅导致提取的数据不准确,还得重新开发。Gartner曾指出,这项工作往往要花费企业80%的时间。

36氪近日接触的Datablau,主要针对这个问题,为企业提供用户数据管理方案,通过技术手段将数据的IT属性和业务属性相融合,节省企业人工开发、整合、沟通的时间。公司今年2月宣布完成数百万元天使轮融资,投资方是跨境投资机构美国中经合集团。

企业存量数据的总量代表大数据,但此前其各个业务的数据集彼此独立。如果企业想了解不同系统间的数据整合在一起能产生什么价值,必须将按照业务逻辑重新拉通。

Datablau充当的就是数据科学家的角色,既有IT知识,又了解企业业务。Datablau会先了解企业有哪些存量数据,再从不同数据库,将不同结构的客户、内部流程、运营等数据进行抽取并脱敏,通过预定义标签以及企业的自有概念,将数据按标签梳理归类,产生数据资产目录和面向业务数据虚拟集。

Datablau主要针对大型客户做私有云部署。企业安装部署Datablau后(一般3~5小时),IT人员将各数据源与平台对接,自动获取或手动设置存量/增量数据模型后,系统就能自动进行数据梳理工作,按照业务概念将数据分类归档。

与Datablau类似的,国外有Trifacta、Paxata、Tamr等。不过,数据准备在美国已比较成熟,中国市场接受程度普遍还不高。原因是,尽管数据准备是大数据分析的必经之路,但短期并不能给企业带来直观的效果。据创始人王琤估计,目前国内有足够能力用好这套技术的不超过1000家企业。他也在探索适合中国市场的商业模式,同时不放弃国际市场。国内一些数据分析公司,如GrowingIO、神策数据、诸葛IO等,主要是针对用户行为数据,Datablau主要是按照业务逻辑拉通企业的存量大数据,更偏后端。

Datablau于2016年投入研发,目前1.0版本已经发布,试用客户包括eBay、国家电网、北大智慧城市等。

团队方面,目前共10人,主要是技术和销售。创始人王琤2005年北京大学毕业,曾任ERwin全球研发负责人、CA技术开发部主任,在数据建模领域有10年经验;CTO朱金宝是前ERwin总架构师,10年ERwin研发经验;销售负责人汤滨,曾任日志易的销售副总裁;首席科学家丁贵广是清华大学软件学院副教授、清华大学软件学院副院长、博士。

[免责声明]

资讯标题: 数据准备工作使数据可信,Datablau要帮企业自动搞定

资讯来源: 36氪官网

36氪企服点评
消息通知
咨询入驻
商务合作