新的数据正以前所未有的速度产生。2003年以前,人类一共创造了5EB(百亿亿字节)数据。而今天,每两天就能创造同样数量的数据。谷歌首席经济学家Hal Varian曾预测,2020年,数据总量将达到53ZB(十万亿亿字节)。
数据的飞速增长也带来了数据存储缺口的扩大。业内普遍认为,存储市场本身是一个万亿市场,而且是一个典型的增量市场,尤其是在中国,数据量18个月翻一番,基于数据存储的大数据分析、机器学习、人工智能的市场则更大。
这也给传统企业带来了挑战。过去,企业中的数据都同业务系统绑定,许多业务系统的应用底下都有自己的数据库。这些数据往往有独特的格式,很难迁移或者被其他业务系统使用,在一个系统或单位内部,数据也无法互通。另外还存在数据的重复存储、缺失、遗漏、以及不同步等等问题。
比如一些银行、工厂,有大量的设备是70、80年代采购的,经过长时间的更迭,逐渐积累了一套IT系统,涉及几千个不同的业务场景、业务系统,而且彼此互相依存,牵一发而动全身。很多时候,不同的数据存在不同的业务系统中,或者同一个业务系统但由不同的机器在采集,这都导致了数据没有统一的标准,而是以割裂的形态存在,也就是数据孤岛。数据只有流动起来,快速有效的进入其他系统,梳理、分析、共享、大数据挖掘及机器学习才有了可能性。因此,如何将库存、销售、财务等不同要素整合起来,打通业务流程,让信息在不同部门间流动起来是传统企业的一大痛点。
互联网公司往往有自己的技术解决方案,但绝大多数中小传统企业无力自行建设数据中心。一些大企业虽然有能力购买大量服务器,但数据增长太快,传统的SAN/NAS等存储方式过于昂贵,对运维也有很高要求,传统企业往往没有相应的IT能力。
36氪最近接触的云城数据,主要为传统中小企业提供冷数据、温数据的集存及管理服务,解决企业对于数据存储的隐私+可用性的需求。目前主要针对教育科研、物联网工业制造行业的用户。
今年2月,云城数据推出了一套企业级解决方案,主要包括一体机和技术服务。一体机本身融合了计算和存储功能,硬件部分主要从思科、紫光等合作伙伴处采购,搭载了自研的数据存储管理系统。CEO王轶捷告诉36氪,企业本地化部署后,一般能在半小时内交付完毕,在不打扰用户的情况下,将企业原本散落在各个员工电脑上的数据分类存到中央服务器上,所有操作后台跟踪记录,遇到员工离职、设备遗失等,只要维护好中央服务器上的数据,数据依然是完整可用的。
之所以主要做冷数据和温数据存储,王轶捷解释,热数据主要是结构化的数据,本身量不大,oracle等公司已经做的很好了,市场空间不大。而非结构化的冷数据、温数据占数据总量的80%以上,增长幅度也很大。
目前涉足存储的公司主要有两类,一是偏硬件做底层存储介质,比如传统的IBM、戴尔、浪潮等,还有36氪此前报道过的中科开迪,二是偏云端服务,比如阿里云、AWS等。云城数据则主要做存储管理系统,企业可以选择将数据存在本地,也可放在云端。简单的说,云城数据相当于为企业提供一个内部网盘,建立项目存储空间,但与一般企业网盘的区别是,它不仅能将人产生的文件同步进来,也能集存设备和系统产生的数据,比如服务器日志、生产线数据等。在这个基础上,云城数据还会提供标准的接口,更好地支持数据分析、挖掘、学习等等工具,方便传统企业与新兴平台之间的对接。
王轶捷说,数据存储管理系统最主要是技术壁垒和思维壁垒。如何把多样、陈旧、海量的数据和业务系统统一存储管理,做一套简单好用的产品,本身是一件很难的事。另外,创始团队主要来自硅谷的数据存储及云服务领域,曾服务美国硅谷各大IT企业多年,非常熟悉企业客户需要什么形式的对接,这是很多互联网思维产生的产品无法做到的。
目前,云城数据已在北京、硅谷设立了研发中心。创始人王轶捷曾是思科总公司SVP移动战略委员会成员,CTO黄青锋由16年硅谷行业经验,CDO单羽曾是谷歌计算中心infrastructure计算及机器学习资深技术带头人,COO怀千江曾任北京无限讯奇( “12580”业务)创始人,并有多次创业经验。
去年5月,公司获得TEEC Angel Fund、水木资本、启迪之星的天使轮投资。
< 这是一则寻人启示 >
我们正在寻找一个了解企业服务的分析师,可以每天跟创业者聊聊项目,跟投资人谈谈行业,顺便能写个云计算就更好不过了,如果你是我们要找的人,请发简历告诉我xuning@36kr.com,仅限全职or实习,坐标北京。
『本文图片来自:Yestone 邑石网正版图库』