EXCEL是进行数据处理、分析的基本工具,从各个公司招聘[数据分析师]的职位要求不难发现,作为数据分析师,熟练掌握EXCEL是必不可少的技能之一。在数据分析过程中,通过Excel可以实现数据清洗、数据分析、数据可视化等功能,那么具体应该怎么使用呢?接下来就由小编为您介绍数据统计与分析,如何进行数据统计与分析。
数据统计与分析
数据清理(Datacleaning)是一种对数据进行重新检查和检查的过程,其目的在于消除重复信息,纠正现有的错误,并提供数据一致性。
通常从以下7个方面进行数据审核。(文字做简单说明,具体操作方法见图内图。)
Selection子集:隐藏原始数据集字段意义相似和数据无用的列,只保留可用的分析数据列。
列名称重命名:确保列名准确地描述了数据集的含义(可以根据行业/公司对数据集含义的理解命名)。
移除重复项:选择一个数据集数据字段内容具有唯一性的列,以此作为检查重复项的基准。
丢失的值处理:选取字段数据完整的列统计计数值(整个选择列之后,计数结果会自动显示在表格右下角),其他字段都将此作为统计缺失值的标准。使用查找→定位“null值”来锁定空值位置。处理空值,与实际情况相结合(人工输入/平均替代/统计模型输入/删除)
一致性处理:确保每个字段都以数字的方式表示,并可计算。第一,通常需要对合并域的内容进行分类;第二,对原有字段数据进行简单公式计算(average,sum,max,min,if,countif,date),将原来的字段数据按简单公式计算(average,sum,max,min,if,countif,date)。最终,过滤后增加的字段检查是否存在错误值,完成对错误值的处理。
递减顺序:按某一领域的递增/降序排列。
离群值处理:用数据透视表对数据分类汇总发现异常值,利用函数公式(IF+COUNT+FIND)区分异常项,筛选出异常项。
利用清洗后的数据,根据业务问题寻找目标,进行数据分类汇总,描述性统计分析,多表关联分析。
资料分类汇总【资料透视表】:利用资料透视表功可实现资料分类呈现,并可按需设定分类后的资料汇总方式,加总/平均数/最大值等。
分析工具库的描述性统计分析:装入“分析工具库”后,选择“数据-数据分析-描述分析”。
多表关联分析:两个表的数据字段有相同的含义,VLOOKUP可以实现对匹配数据的跨表格的精确查找;另外,使用该函数可以实现数据按条件分组,首先定义分组规则(临界值、分组名称、分组范围),将近似查找返回值作为对应组名。
随著社会经济的发展,各类企业不断壮大,小型企业不断涌现,数据分析日益重要。许多毕业生,相关行业的从业人员或者想要转行的人开始考虑数据分析行业,大家纷纷在平台上提出各种问题,比如,数据分析是什么?如何进入数据分析员的零基础等等,其实数据分析入门比较简单,只要学会使用软件就能算粗浅的入门。以上就是小编为您带来的数据统计与分析,如何进行数据统计与分析。
[免责声明]
文章标题: 数据统计与分析,如何进行数据统计与分析
文章内容为网站编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时沟通。发送邮件至36dianping@36kr.com,我们会在3个工作日内处理。