本文作者John De是面向开发者的平台Precog的联合创始人,可以在Twitter上关注他@jdegoes。
这些日子,大数据并不少见。哪怕你只是一家小型创业公司,一天下来你可能就拿到了几个G的数据,而Instagram一天产生的数据则高达500个T。坐在不断增加的数据上的你,挠着头苦想:“大数据我是有了,要怎么利用它们?”
只是拥有数据自然用处不大,真正的赢家是像Amazon或Netflix这类公司,他们比竞争对手更好地利用了大数据而取得了竞争优势。如果不能数据变成收入,你的Hadoop集群和里面包含的大量的数据就没什么意义了。
要是你能比对手更好地利用大数据,你甚至有机会跻身成为像Amazon和Netflix这样的大数据资深玩家。
如何才能把数据变成钱呢?有两种办法:数据驱动的流程(data-driven processes)和数据驱动的产品(data-driven products)。
数据驱动的流程(data-driven processes)
商业分析师往Excel里输入方程,在SQL数据库里运行特定的查询语句——在大数据时代这样是不够的。新时代需要更大胆、更无畏的数据探索者,无论是在小数据还是大数据的世界里,他都能熟练运用工具。
被称作“数据科学家”的他,是下一代的数据极客,他充分了解传统的BI工具、查询语言、统计办法和机器学习技术。
优秀的数据科学家能在方方面面帮到你:弄清楚你产品的哪个地方行得通或是行不通(这是Zynga的数据科学家的角色);创造预测模型,让你一窥未来,从而在眼前做出更好的决策(这是@WalmartLabs的做法)。
数据科学家能怎么帮到你?下面有几个具体的例子:
如果你销售的是一款SaaS应用,数据科学家可以帮你分析、找出带来高营收的用户的共性。比如,这类用户可能会以特定路径转化成为付费帐户,人群特点也可能相近(性别、收入、地域、年龄范围等),也会以特定的办法使用该产品。所有这些洞见有助于进一步打磨广告、市场营销以及产品,以提高营收。
数据科学家可以确定某个定价范围或产品是否会挤占来自其它定价或是产品的销量,由此,你可以优化你的定价策略和产品线。
数据科学家可基于历史数据创建预测模型,让你做出相对更靠谱的预测。比如,你可以分辨哪一类顾客更有可能是怀孕的女性(Target就曾做过这样的事情),或是销售漏斗里的哪类顾客最有可能在哪个水平上被转化。
数据科学家能帮你弄清针对数据你要问些什么正确的问题。比如,数据科学家可能会建议你把营销数据和网站日志数据以及交易数据都关联起来,以确定市场推广活动背后的ROI(投资回报率)。
数据驱动的产品(data-driven products)
除了利用数据驱动业务流程以外,数据还可被用来增强产品的功能。有些公司会把数据打包到一款有用的产品里,再转售给其它公司。
Twitter自己并不是一款数据产品,但它把数据授权给了像DataSift这样的数据服务公司,后者接着创造了一款数据产品,而别的公司痛快地接受了它所提供的分析结果。也有一些媒体公司会把观众收视率数据打包到产品里,再转头卖给频道制作人和内容创造者。
然而,大多数创建数据驱动的产品的公司并不会简单地创建数据产品再转手卖掉。他们会利用数据把现有产品变得更加高效、更加智能,或是更具有洞察力,从而直接或间接地产生额外的收入。
下来我举几个例子:
广告平台可以针对不同的观众展示不同的广告,以最大限度地提升点击率、以及其它产生营收的用户行为。
电商应用可智能地做产品推荐,以最大化增加消费者的购买率(包括原本就打算买的,以及许多购买计划外的东西)。
Publisher可通过智能分析和推荐,为每个用户做出个性化的页面,以最大化用户在网站上的停留时间,并产生更多的广告收入。
视频平台可捕捉所有的用户交互行为,并向内容创作者提供详尽的分析报告,帮助他们对重要的指标做出优化(参与率、播放率、转化率等)。这也是间接货币化的例子之一。通过添加一个由数据或分析支持的功能,平台也有望对用户产生更大的吸引力。
数据驱动,你也可以做到
下面是我的几个建议:
集中地收集所有数据。在存储成本直线下降的今天,廉价乃至免费的大数据存储服务随处可见,如果你没有全方位地收集数据,你就大错特错了。我经常这样告诉一些公司:就算你忽略你拥有的数据,但你却绝不可能分析你没有的数据。非结构化或是半结构化的数据存储服务允许你把原始数据先存起来,等到需要的时候,再付费把结构化的数据提取出来。所以说,你是没理由不把经过你手的数据给收集、存储起来的(交易、交互、行为数据、传感器数据、用户生成的内容、日志文件等等)。
聘请一位数据科学家。如果你是一家创业公司,你团队至少需要一位数据科学家,或是能够兼任数据科学家角色的成员。假如你公司有了一定规模,就有必要准备 成团队的数据科学家了。比起从外部聘请,内部培养会更容易些。优秀的商业分析师,或是在BI和SQL有优异背景的人,都有机会成为数据科学家。他们需要配备适当的工具,并获许访问全公司的数据,这样,他们才可以回答特定的问题、进行探索性的数据挖掘、支持BI团队、并协助数据产品化的工作。
把数据产品化。任何一家公司,但凡拥有专有的数据,都应该好好考虑把数据利用起来,打造新的产品,或是在现有产品上创建由数据驱动的功能。任何一家公司,只要它有桌面、移动、Web、或基于媒体的应用,它就有专有的数据(也就是说,在这个数据时代,绝大多数的公司都有专有数据!)。各类公司,尤其是广告和零售公司,已利用数据驱动智能化的功能,获得了数以百万乃至十亿美元计的增量收入(incremental revenue)。
如果你是一家B2B的SaaS供应商,向你的客户提供自助的报告服务,是你把数据变成产品的简易办法,也能间接产生额外营收。如果你是一个电商平台,利用你手头的数据做个性化推荐,可以带来可观的增量收入。如果你做的是一款面向消费者的应用,利用数据把应用变得更加聪明,也能提高易用性和用户活跃度。走向数据产品化的第一步,就是让团队里的某个人开始思考利用你的数据资产可以做出些什么功能或是产品。但最终,你还需要专门的工程师资源,把数据变成功能和产品。
受数据驱动的你
大数据真正讲的不是数据本身,而是要探讨怎样利用数据在公司内部驱动业务流程和产品功能。过去几年迅速窜起的数据科学就是“数据已成为21世纪的货币”的有力证据。如果你置手头的数据不顾,你就在竞争中处在了劣势。
只需简单的几步,比如把所有接触到的数据都收集起来,团队拥有至少一位数据科学家,在数据产品化方向上用力,你就是在有效地“花钱”——花在你数据仓库里不断积累起来的“数据货币”。
via TC