| 企服解答
大数据的定义:大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
大数据的概念:简单来说,大数据就是规模很大的数据。大数据的核心价值在于存储和分析海量数据;大数据技术的战略意义不在于掌握大量数据信息,而在于专业处理这些有意义的数据。数据主要分为结构化数据、非结构化数据、半结构化数据和元数据。
大数据定义和概念
1、结构化数据
结构化数据是具备一定模式或者结构的数据,这些数据在一个记录文件中以固定的格式存在,比如说我们常常遇见的存储在数据库中的表格数据,这些数据有统一的固定格式,可以通过固有的键值对获取到相应信息。结构化数据可以通过关系型数据库来表示和存储,但是我认为首先要依赖一个数据模型,即这个数据模型指的是数据是怎样被存储的。这样存储在数据库中的数据以二维形式表示:数据以行或列为单位,一行或者一列表示一条信息,每一行或每一列数据的属性是相同的。
2、非结构化数据
与结构化数据相反的是非结构化数据,结构化数据具备模式,非结构化数据是指信息没有一个预先定义好的数据模型来表现,所以称为非结构化数据。我们通常遇见的文本型数据,比如这个文本型数据中存储的是本篇文章的内容;比如说文字型数据,但是数据中又有很多像时间、数字的信息;再比如说图像、音频、视频数据。就我知道的图像数据而言,比如说对一个手写数字(0-9)灰色图片来说,如果图片像素是[公式]的,那么这个图片会以二进制数据0/1通过一个32行32列的矩阵存储。
3、半结构化数据
半结构化数据是介于结构化数据(如关系型数据库)和非结构的数据(如声音、图像文件等)之间的数据。它的数据是有结构的,但却不方便模式化。XML和JSON文件是半结构化数据的常见形式。由于这种数据的文本性质及其与某种层次结构的一致性,它比非结构化数据更容易处理:因为没有模式限定,数据可以自由流入、更新,在使用的时候模式起作用,构建数据模式来搜索数据。
4、元数据
元数据是描述数据的数据,主要指的是描述数据属性的信息。这种类型的数据大多是机器生成的,可以附加到数据中。
| 拓展阅读
目前来说,大数据在各个行业领域,都是有应用的。
1、物联网
物联网,是互联网基础上的延伸和扩展的网络,将各种信息传感设备与互联网结合起来而形成的一个巨大网络,实现在任何时间、任何地点,人、机、物的互联互通。
2、智慧城市
智慧城市就是运用信息和通信技术手段感测、分析、整合城市运行核心系统的各项关键信息,从而对包括民生、环保、公共安全、城市服务、工商业活动在内的各种需求做出智能响应。
3、增强现实(AR)与虚拟现实(VR)
AR增强现实(Augmented Reality)技术是一种将虚拟信息与真实世界巧妙融合的技术,广泛运用了多媒体、三维建模、实时跟踪及注册、智能交互、传感等多种技术手段,将计算机生成的文字、图像、三维模型、音乐、视频等虚拟信息模拟仿真后,应用到真实世界中,两种信息互为补充,从而实现对真实世界的“增强”。VR拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统,它利用计算机生成一种模拟环境,是一种多源信息融合的、交互式的三维动态视景和实体行为的系统仿真使用户沉浸到该环境中。
4、区块链
从科技层面来看,区块链涉及数学、密码学、互联网和计算机编程等很多科学技术问题。从应用视角来看,简单来说,区块链是一个分布式的共享账本和数据库。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。
5、语音识别
语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别是一门交叉学科,所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
[免责声明]
文章标题: 大数据定义和概念
文章内容为网站编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时沟通。发送邮件至36dianping@36kr.com,我们会在3个工作日内处理。