学习数据分析?要从这六步走
大数据时代,企业面临的境况正日益变得更为复杂多变,企业的决策越来越难以靠个人的智力与经验来应付了,因此现代决策应该更多地依靠科学,对于企业来说,内部海量数据蕴含着大量的“价值金矿”,根据IDC调查的2000多个大中型企业在全球20个国家表明,如果一个公司可以采取一套完整的大数据解决方案(包括数据收集、整合、筛选、分析、共享)。那么,在未来四年中,企业将从其数据资产中发掘出额外60%的数据红利。这就是为什么企业需要BI商业智能的原因。
说说BI能够给企业带来的几点好处。
1)提高数据分析效率
2)培育数据文化环境
3)辅助领导科学决策
举几个例子,一、BI数据分析可以对原始杂乱的数据进行清洗、脱敏、整合、分析和显示,以提高数据的利用率;二、BI数据分析还可以预测数据,评估风险,协助决策者决策,合理规避风险;三、BI数据分析可以通过可视化的方式,更直观地显示数据,让用户更直观地了解数据的价值,达到一图胜千言的效果。
那么如何做数据分析,数据分析的步骤是什么?
总的来说,数据分析一般可分为六个步骤:1、识别需求→2、确定思路→3、数据收集→4、数据处理→5、数据分析→6、制作报告
数据分析步骤:
第一步、识别需求
识别需求是确保数据分析过程有效性的首要条件,可以为收集数据、分析数据提供清晰的目标,应满足管理者决策和过程控制的需求,确保数据分析产出满足管理者的诉求。
第二步、确定思路
分析思想是分析的灵魂,是需求识别到细化分析工作的过程。分析思路清晰有逻辑,能有效避免反复分析问题。从分析目的出发,全面、深入地拆解分析维度,确定分析方法,最终形成完整的数据指标体系。
可以参照5W1H方法:
l Who:数据使用者
l When:数据使用时间
l Where:数据使用场合
l Why:使用数据原因
l What:具体数据格式
第三步、数据收集
按照上一步确定的数据分析内容,来收集相关数据的过程。一般来说,数据可分为原始数据和清洗过的数据。可以利用BI数据连接的功能,可以对关系型数据库、非关系型数据库、多维数据库、Excel文件进行连接。
第四步、数据处理
数据分析80%的时间都是在整理数据,把其变成适合分析的数据。数据处理是数据分析必不可少的阶段,涉及到数据的计算、分组、转换、脱敏等操作,在这一点上,永洪BI通过拖拽的方式就能够快速满足用户数据处理的诉求。
以缺失值处理为例:可以通过以下几种方式进行处理。
1.用一个样本统计量的值代替缺失值,一般用的比较多的处理方式就是使用该变量的样本平均值代替缺失值。
2.用一个统计模型计算出来的值去代替缺失值。例如回归模型、判别模型等。
3.将有缺失值的记录删除,缺点是可能会导致样本量的减少。
4.将有缺失值的记录保留,只在相应的分析中做排除。
第五步、数据分析
在完成数据处理之后,就需要通过多种数据分析的方法与模型对处理的数据进行和研究,通过数据分析从中发现数据的内部关系和规律,掌握好这些关系和规律就能够更好的进行数据分析工作。
常见的数据分析方法包括:对比分析法、分组分析法、结构分析法、平均分析法、交叉分析法、综合评价分析法、杜邦分析法、漏斗图分析法、矩阵分析法等。
对比分析法。这种方法分为静态比较也叫横比是指在同一时间下比较。动态比较也叫纵比是指在同一条件下的不同时期进行比较。适用于:不同时期比、与目标比、同级部门单位地区比、行业内比、活动效果比等
对于结构分析法也是一种不错的方法,是指被分析的总体内的各部分与总体间进行对比的分析方法。一般来说在总体内占有的比例越大,说明对总体的影响也就越大。
而漏斗图分析法适用于业务流程比较规范,周期较长,各流程环节涉及复杂业务过程较多,其实在分析用户的流失率、购买率转化率等都可以使用这种方法。
第六步、制作报告
制作报告将数据分析形成的结果进行可视化,并按主题在界面上进行整合,需要注意的几个点,1、整体布局,需要按用户角色进行设计,面向高层可以参考领导驾驶舱的设计,从视觉传达的角度,贴合用户的角色职能。2、UI设计,需要借鉴公司内部UI标准规范,达到统一、美观的效果。3、报告内容,可按不同角色进行设计,如:面向高层的战略看板,一般会通过纯数字形式来展示核心指标,不需要复杂的图表。面向中层的业务看板,注重过程和组成,多使用增长曲线等形式来体现数据分布、规律和变化。