| 企服解答
数据分为三类,一种叫结构化数据,一种叫非结构化数据,还有一种叫半结构化数据。
大数据简单介绍
1、结构化数据
即固定格式和有限长度的数据。例如填的表格数据,姓名:xxx,名族:汉,性别:男。这都叫结构化数据。
2、非结构化数据
现在的非结构数据越来越多,比如网页,有的网页很长有的很短;还有就是语音﹑视频﹑图片这些都是非结构化数据。
3、半结构化数据
是一些XML或者HTML的格式,没有从事技术的人可能对这部分数据不太了解,不过没有关系,我们只需要知道这部分数据是介于结构化和非结构化数据之间的数据,即部分格式化和有限长度的数据,部分没有格式化和固定长度的数据。
| 拓展阅读
截止到目前来说,人类社会的数据的产生大致分为三个阶段:运营式系统阶段、用户原创内容阶段和感知式系统阶段。
1、运营式系统阶段
可以说是从数据库的诞生开始的。大型超市销售系统、银行交易系统、股市交易系统、医疗系统、企业客户管理系统等等,这些系统都是建立在数据库之上的。他们用数据库保存大量结构化的关键信息,用来满足企业的各个业务需求。这个阶段,数据的产生是被动的,只有当业务真正发生时,才会产生新的数据并保存到数据库中。如股市的交易系统,只有发生一笔交易后,才会有相关记录生成。
2、用户原创内容阶段
互联网的出现,使得数据的传播更加快捷。web1.0时代主要以门户网站为代表,强调内容的组织和数据的共享,上网用户本身并不产生。真正的数据爆发产生于以“用户原创内容”为特征的web2.0时代,如wiki,博客,微博,微信,论坛等等这样的技术。这个时候,用户是数据的生成者,尤其当智能手机的普及,更是让用户随时随地的发微博,传照片,数据量急剧增长。
3、感知式系统阶段
物联网的发展最终导致了人类社会数据量的第三次飞跃。物联网中包含了大量的传感器,如温度传感器,湿度传感器,压力传感器,位移传感器,光电传感器等,再如视频监视摄像头也是物联网的重要组成部分。物联网中的这些设备,无时无刻不在产生大量数据。与web2.0时代的人工数据的产生方式相比,物联网中的数据自动产生方式,将在短时间内生成更密集,更大量的数据,使得人类社会迅速进入“大数据时代”
[免责声明]
文章标题: 大数据简单介绍
文章内容为网站编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时沟通。发送邮件至36dianping@36kr.com,我们会在3个工作日内处理。