首页 >热门资讯> 商业智能(BI) > 被90%的人误读的大数据, 我们用“人话”重新解释了一遍 >

被90%的人误读的大数据, 我们用“人话”重新解释了一遍

转载时间:2021.09.06(原文发布时间:2019.05.31)
46
转载作者:36氪企服点评小编
阅读次数:46次

编者按:本文来自数据赋能,作者:小王,36氪经授权发布。

2012年,一位高中生获得了谷歌科学比赛的第一名,原因是她针对700多万名乳腺癌患者的数据,通过机器学习设计了一套乳腺癌癌细胞位置的算法,预测的准确率达到96%,水平超过了几十年临床经验的专科医生。    

成功的关键,得益于对大数据的运用,因为没有哪个医生能见识700多万个病例。

今天,大数据是无数媒体和大众津津乐道的话题,是资本垂涎的趋势,更是国家的战略。但大数据究竟是什么,每个人的答案可能都不同。

在解释大数据之前,我们要知道什么是数据?

我的总结是,数据不是由数字组成的集合,而是对行为的记录,是反映和再现物理世界的细胞,它可以分为在线数据和离线数据——互联网记录在线数据,传感器记录离线数据。

互联网的快速发展,让数据快速采集和记录形成新的盈利模式。

Facebook的收入90%以上来自精准广告,是源于对用户数据的挖掘,这些数据包括用户的年龄、地址、爱好、身高、体重、社交互动,Facebook轻松利用用户的数据赚取了数十亿美金。

而离线数据最大的来源在线下。比如,当你在等电梯的时候,发现电梯广告展示的是卫生巾广告,如果屏幕上能有传感器,知道屏幕面前是男性,就有可能会推送针对男性的广告。通过线下数据和场景资源结合的业态,未来有可能出现一家新型媒体集团。

我们的行为不断地改变着物理世界,无论在线数据或者离线数据,都有非常大的价值。

那什么又是大数据呢?显然不是在数据两字前面加个“大”字,大数据是将一部分行为多次而连续地记录形成数据,再通过技术手段找寻这些数据中存在的规律和相关性,进而预测或者判断我们想要知道的信息。

这个解释显然有点拗口,但我们可以通过一些案例,从几个不同维度更直观的去理解大数据的特点:

体量巨大,数据是少有的越用越多的资源

数据不是消耗完了就完了,而是越用越多,这是一种庞大的生产资源。

1949年,第二次世界大战刚结束不久,联合国教科文组织在瑞士洛桑,宣告成立欧洲核子物理研究中心。70年过去了,在这里进行了无数的核子试验,每秒钟能够产生近40TB的数据。

40TB是什么概念?简单来说,几乎等于每秒钟要产生1万多部4G大小的电影储存量。

种类繁多,甚至包括你穿衣服的次数

大数据可以让人类重新思考什么东西有资格成为新的数据。除了传统的文字、图片、声音、视频、地理位置等数据外,大数据的主体可能是一个电饭锅或者一件衣服。

很多人不知道,奢侈品牌PRADA其实做了这么一件事:它在商品上添加芯片,然后在试衣间设置了传感器,这样能清楚知道每件衣服被试了多少次。

如果有件衣服很多人都试用了却没有购买,背后可能是它穿在模特身上好看,穿在顾客身上不好看,品牌方根据这些数据及时修改设计方案,通过这种方式,PRADA的库存量一度减少了20%。可见,传统行业利用大数据,就能更好地实现市场预判和销售提升。

处理及时,别堵在高架桥上唱五环之歌

网络上有这样一个段子:如果没有智能车载导航,外地人千万别来重庆,因为“走错一条道,重庆一日游。”

数据的及时处理,其重要性不言而喻。过去我们只能靠汽车广播来了解交通状况,但信息往往会滞后15分钟以上,而这15分钟路上可能会发生无数状况。

这样的信息显然没啥价值,但能定位的智能手机普及以后可就不一样了。

四维图新是中国最大、世界第三大的数字地图提供商,2017年通过与政府合作相继推出交警大数据平台、公安地图大数据平台、城市交通画像大数据平台、车联网大数据平台,根据数字地图流动的速度和所在位置,为用户提供实时的交通路况信息,如今每天通过各种载体访问四维图新地图数据的用户已经超过了1.5亿人。

价值密度低,能解决问题的数据才是好数据

大数据价值不在于数据量大,而是与数据本身的效果和真实性有关。

举个例子,一个火热的炉子,你只需要碰到一次就明白,热炉子会烫伤你。但是,你可能需要喝几千杯咖啡,才能确定咖啡是否会让你头疼。原因就在于,热炉子本身的效果强度很高,因此,只需要一项数据就能显现出结果。

通过上述的解释,足以印证大数据的重要性,但大数据的价值不是一蹴而就的,而是与它的发展程度息息相关。

从人类的历史进程来看,大数据的发展以及被赋予的价值,被分成了3个阶段:

第一个阶段,大数据的价值是辅助商业进行决策。

黑人牙膏品牌始于1933年上海,是最早采用易挤软管取代传统铝管包装的牙膏厂商之一。浙江潮州市安吉县鑫鸿超市的一个角落,黑人牙膏的堆头摆放在这里,黑人牙膏的业务员每天来这里巡视,查看销售情况,并拍摄10张照片传回总部,这样的点每个业务员一天要跑10个,不仅耗费了大量人力物力进行问卷调查,结果却不一定精准。

大数据时代这一切都变得简单,各大电商网站可以为日化品牌提供详尽的牙膏产品数据,是抗敏类卖的最好,还是美白类最好?那个价格区间的牙膏最受欢迎?差评最多的牙膏是哪个?一眼便知。

第二个阶段,大数据的价值在于创造。

我们经常会发现这样的现象,你刚在微信上说要去旅游,就在朋友圈里看到了机票的广告。女朋友刚跟你说想买个包,你就在淘宝看到的相关的推荐。

APP当然不会窃听你的短信和电话(至少法律上不允许),是你的行为数据出卖了你。

当前,我们大部分的行为数据都被少数几个APP所掌控。除了基础的个人信息外,你的消费记录、打车频率、信用卡还款,发出的红包数都让他们对你一览无遗。

有一家在美国上市的中国公司,替我们手机上的App应用提供一个服务套件,它从这些App里面获得了用户的行踪和设备使用情况,然后把这些数据输出成精准的营销、市场情报等方案,进而获得了高额利润。我们莫名其妙就成为别人赚钱的工具。

第三个阶段,大数据的价值是塑造与预测。

一个结婚多年的男性,突然开始关注母婴类公众号,并每天在淘宝上花半个小时浏览婴儿用品。不用说,他老婆一定是怀孕了。

一个从来不运动,整天沉溺于游戏的宅男,游戏在线时间从5个小时变成了1个小时,还在京东买了一堆男士护肤用品和衣服。是的,他可能找到了自己的心上人。

用海量的数据与标签精准描述一个具体的个体,大数据已经逐渐能够将一个人的行为信息进行量化,并给每一个人贴上独特的标签,其准确性超过了90%!

因此,从大数据价值的3个阶段来看,大数据思维和能力成为找到和处理世界隐藏问题的捷径。

比如美国警察,就是利用大数据思维进行缉毒。过去,美国警方缉毒重点是切断南美洲的毒品供应,但后来发现,只要有些能提炼毒品的植物,贩毒者甚至可以在家里用盆栽种植大麻,警察很难在浩如烟海的人群和民宅中找到毒品犯罪者。但是,仅仅通过研究大麻盆栽种植需要的光照、喷水、气温调节等条件,以及相应用电数据的规律,美国警察通过分析智能电表收集的用电量,很快抓住了很多在家里种大麻的人。

而落脚在企业身上,传统企业利用大数据转型升级,难度并不在技术与资金,难就难在企业一把手是否拥有大数据思维。

上周,一篇《这一万字里藏着中国未来最大的商机》的文章刷屏朋友圈,文中列举的一些数据颠覆了很多读者的认知。比如,“全国约有90%以上的人没有喝过星巴克”,“13亿人没有出过国”,“10亿中国人没有坐过飞机”,等等。

如果你是一名企业的高管或者一把手,你是否能够从这些数据中敏感的看到一些价值点?还是简单的将他当做一篇热点新闻一划而过?

以往,我们所具备的都是直线思维和常见的商业思维,想当然的去认为一些事情会按照自己的想法所发展。大数据思维恰恰就是要摒弃这样的传统观念,依靠严谨的数据资源去做出最理性的判断,达到洞察力和大局观的结合。

我们知道,全世界现在总人口是76亿,其中0到15岁的儿童有20亿人,到2100年全世界总人口会达到110亿,那么0到15岁的儿童有多少呢?

 这个问题答对的人只有15%,甚至在达沃斯世界经济论坛上,难倒了各国领袖和世界500强的高管。它的正确答案是20亿,经过了80多年的发展,年轻人的数量没有增加。

你肯定会奇怪,世界人口不是增加了40亿,怎么0到15岁的儿童数量没有变化呢。但实际上,世界人口在未来80多年里增加的都是15到74岁之间的成年人。医学技术的不断普及,延长了老年人的平均寿命,老年段人口自然增加。而女性受教育程度和社会地位的提高,也导致了生育率的下降。

所以,如果你不要看到人口增长的数据,就认为每个年龄段的人口都会增长,这会严重影响你对商业市场的判断,从而造成重大损失或者错过市场机会。

拼多多的成功便是洞察力与大局观的结合,一个 2015 年 9 月才成立的公司,运营 3 年便成功上市,活跃用户数突破了 3 亿人次。很多生活在一二线城市的人都非常好奇,这样一个靠拼团模式销售低价产品的平台,为什么成长速度这么快?

原因同样藏在数据里:根据国家统计局 2017 年发布的《中华人民共和国 2017 年国民经济和社会发展统计公报》数据显示:2017 年全国人均全年可支配收入为 2.6 万元,国民人均月可支配收入仅为2000多元。

拼多多通过数据,洞察到中国还有大量的三四五线城市的消费者,以及乡镇和农村消费者。他们依旧会为一双9.9元包邮的拖鞋所打动,为一部600元的智能手机所吸引,尽管商品质量并不尽如人意。

这显然与我们平时观察到的现象完全不同,沉浸于消费升级狂欢里的人,很容易被表象一叶蔽目。所以,培养大数据思维,并且拥有数据处理能力,是政府、产业、企业和个人看清未来和真相的基因,这就是为什么我们要长篇大论、大费周章的用数据去记录和解读价值,创建“数据赋能”的初心。

坦率的说,我们并不好为人师,只是想跳出“用技术解读技术”的怪圈,将目光聚焦于大数据与产业化的融合,为更多想要了解大数据的企业与个人带去最为直观的方法论。

每周三和周日,我们将会推出自己的原创内容,选题涵盖大数据解决方案、专家学者的数据思想、实践者的言传身教,以及一些有趣有料的泛大数据内容。

引用传奇投资人查理·芒格的一句话:我的剑只传给那些能挥舞它的人。

所以,欢迎你的到来。

[免责声明]

资讯标题: 被90%的人误读的大数据, 我们用“人话”重新解释了一遍

资讯来源: 36氪官网

36氪企服点评

商业智能(BI)相关的软件

查看更多软件

大厂都在用的商业智能(BI)软件

限时免费的商业智能(BI)软件

新锐产品推荐

消息通知
咨询入驻
商务合作