| 企服解答
从大的知识体系结构来看,学习大数据需要具备三方面基础,分别是数据库知识、数学和统计学知识、计算机知识,选择不同的主攻方向还需要有不同的学习侧重点。
学大数据需要具备什么基础
1、数据库知识
数据库知识是学习大数据相关技术的重要基础,大数据的技术体系有两大基础,一部分是分布式存储,另一部分是分布式计算,所以存储对于大数据技术体系有重要的意义。初学者可以从Sql语言开始学起,掌握关系型数据库知识对于学习大数据存储依然有比较重要的意义。另外,在大数据时代,关系型数据库依然有大量的应用场景。
2、数学和统计学知识
从大数据岗位的要求来看,大数据分析岗位(算法)对于数学和统计学知识的要求程度比较高,大数据开发和大数据运维则稍微差一些,所以对于数学基础比较薄弱的初学者来说,可以考虑向大数据开发和大数据运维方向发展。
3、计算机基础知识
计算机基础知识涉及到三大块内容,包括操作系统、编程语言和计算机网络,其中操作系统要重点学习一下Linux操作系统,编程语言可以选择Java或者Python。如果要从事大数据开发,应该重点关注一下Java语言,而如果要从事大数据分析,可以重点关注一下Python语言。计算机网络知识对于大数据从业者来说也比较重要,要了解基本的网络通信过程,涉及到网络通信层次结构和安全的相关内容。
| 拓展阅读
关于大数据技术主要具有以下四个方面的特点:
1、大数据技术可存储巨量数据
大数据技术一般指的是芯片存储技术,可存储数据超过宇宙天体数的三倍以上,互联网一天所产生的数据内容可以刻满1.68亿张DVD,相当于《时代》杂志770年的文字量。芯片存储技术可存储的数据能够达到千万亿(PB)、百亿亿(EB)乃至十万亿亿(ZB)的级别。
2、大数据技术可以抓取、收集类型繁杂的数据
包括各种各样的语音、非结构化数据、图像、文本信息、地理位置信息、网络文章等。联合包裹速递服务公司(UPS)早在2009年就开发了行车整合优化和导航大数据技术系统(ORION)对快递线路进行预测和优化,截至2013年底,ORI⁃ON系统已经在大约一万条线路上得到使用,在多送出42万件包裹的情况下,为公司节省燃料150万吨,少排放二氧化碳1.4万立方米,大数据技术正在引导物流企业将洞察力快速转化为公司决策。
3、大数据分析具有较高的商业价值和应用价值。
物流领域的数据量是非常巨大的,包括来自企业、互联网、港口、运载工具等的数据,如何从如此巨大的数据中挖掘企业所需的数据资料,就需要借助大数据分析技术,如利用大数据来分析集装箱移动信息,物流企业就能知道哪些港口有剩余运载量,哪些港口吞吐量大,货物周转速度快,应在哪个位置的港口部署海运业务,大数据已经成为智慧物流的引擎。
4、计算速度快。
采用非关系型数据库技术(NoSQL)和数据库集群技术(MPP NewSQL)快速处理非结构化以及半结构化的数据,以获取高价值信息,这与传统数据处理技术有着本质的区别。
[免责声明]
文章标题: 学大数据需要具备什么基础
文章内容为网站编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时沟通。发送邮件至36dianping@36kr.com,我们会在3个工作日内处理。