「工欲善其事,必先利其器」,一个称手的工具可以使我们事半功倍。对数据分析员而言,数据分析流程主要包括[数据获取]、[清洗]、[统计分析]、[数据可视化]四个部分。这些组合中最常用的组合是SQL+Excel+可视化软件。接下来就由小编为您介绍常用的数据分析工具有哪些。
常用的数据分析工具有哪些
Excel是最实用的综合数据工具,但Excel真正被所有人使用的东西都是很少一部分。
功能,透视表可以解决大多数问题;PowerQuery+PowerPivot自动实现数据清洗和数据建模;数据分析工具库可以快速进行常用统计分析,如回归、方差分析、相关分析等。
假如Excel基础一般,建议先去刷两遍《王佩丰Excel实战课》,可以帮你解决大部分问题,网易云课堂有免费课。
如Excel是常用的周期报告,推荐你学习PowerQuery+PowerPivot。PowerQuery是一个Excel插件和PowerBI组件。为各种类型源数据提供链接和预处理工作。PowerPivot可以处理查询,并结合数据透视、切片器和过滤器,对已规划的数据进行数据刷新,并进行交互操作。
通常,PowerQuery和PowerPivot一起使用,前者负责数据连接和清洗,后者负责计算和分析。可报小课系统学习,或查阅公开的资料。
比如:PowerQuery爱好者(pqfans.com)、微软网站PowerPivot-概览与学习-Excel(microsoft.com)
SQL是数据分析员的基本要求,大多数数据来源于数据库,SQL在数据获取和数据清理两个环节中使用。编写SQL需要回答两个问题:1.数据来自哪里?2.如何提取?
1.数据来自哪里?
编写SQL的先决条件是熟悉数据表的结构,简单说就是从哪里获得数据,需要包含数仓结构、每层内容、命名规则、数据计算周期等。要熟悉企业数据表结构并不简单,需要逐步掌握。推荐先弄清哪些常用指标表的来源,再去熟悉公司数仓的架构,最后结合工作需求逐步了解其他数据模块的内容。
2.如何提取?
了解数据表结构后,要实现日常数据提取与分析,需要熟悉select、distinct、where、and&or、orderby、insert、update、delete等等。
select--查找column1、column2、Sum(column3)--从tablewherecolumn1=vluse--条件groupby--分组column1,column2orderbycolumn1desc--排序。
在数据量大、数据结构复杂的情况下,简单的数据提取往往不能满足要求,需要掌握高级语法(如多表链接、子查询、开窗函数、多维汇总、正则表达式等),同时也需要理解诸如Access、Oracle、Mysql、SQLServer、DB2等主流数据库语法差异,并对表整理常用函数进行比较。网上有许多SQL的免费学习资料,比如W3schoolSQL教程、SQL教程、菜鸟教程等,可以做入门课程。也可以利用身边的好友资源,喝杯咖啡聊聊遇到的问题。
“数据可视化”是将数据分析结果转换成图表的过程,其最终目的是洞察数据中蕴涵的现象和规律,这其中包含着多种含义:发现、决策、解释、分析、探索和学习。现在我们只从工具使用的角度来讨论可视化。目前市场上的数据可视化工作很多,但是基本的逻辑是相通的。首先推荐学习一两个工具,PowerBI是开始时比较合适的数据可视化工具。要掌握每一种数据源的连接方法,表格计算和功能,绘制各种图表。PowerBI是微软开发的一款商业智能软件,专门做数据分析,分析家们通常用Excel就能上手。
数据分析工具也在不断演变,需要根据公司的业务情况来选择。例如做市场调查、竞对分析经常使用Python来获取外部数据,通常使用统计分析领域的SPSS,以及调用地图开放平台来进行地图可视化绘制。分析工具与分析方法在数据分析工作中是密不可分的,科学的方法与高效的分析工具相结合,才能提高分析的效率和质量。以上就是小编为您介绍的常用的数据分析工具有哪些。
[免责声明]
文章标题: 常用的数据分析工具有哪些
文章内容为网站编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时沟通。发送邮件至36dianping@36kr.com,我们会在3个工作日内处理。