热门文章> 数据分析的几种基础方法 >

数据分析的几种基础方法

36氪企服点评小编
2022-07-14 17:21
530次阅读

      无论是产品还是运营,在工作中都不可避免地会遇到与数据相关的场景。此时,如果我们能够掌握一些数据分析方法,它可以帮助我们更快地获取信息。那么,什么数据分析方法简单且易于掌握呢?下面就由小编为您介绍一下数据分析的几种基础方法。

数据分析的几种基础方法数据分析的几种基础方法

      “你做数据分析有啥方法论?”无论是工作还是面试,此问题一出,都会难倒一片同学。妈耶,每天照单跑数就知道,但方法论是个什么鬼!今天介绍给大家基础的九种方法,先开个头哦。

一、什么是基础方法

      从本质上看,几乎所有工作都和数据有关系,都或多或少需要一些数据分析方法。但数据本身是有门槛的,很多人上学的时候就怕数学课,更不要说复杂的理论了。因此,所谓基础数据分析方法,应该是:

      不涉及高等数学、统计学、运筹学、算法原理;
      不涉及复杂的业务逻辑、因果推断逻辑;
      不局限于特定的业务场景,有普适性。
      总之,人人能用的,才是基础方法。

      基于这个理念,我们为大家整理了九种基础分析方法,简单又好用。

二、从一个指标开始

1. 周期性分析法

      最基础的分析方法,可以从一个指标开始,这就是“周期性分析法”。

       所谓“周期性分析法”,操作上非常简单,就是把一个指标的观察时间拉长,看它是否有周期变化规律。

      这种方法分析简单,但是非常实用。因为新手经常因为不懂看周期变化,引发笑话。诸如:

      “我发现昨天指标大跌”——昨天是周末,本来就该跌(自然周期变化)
      “我发现A产品卖得很好”——A产品刚上市,它就该卖得好(产品生命周期)

      很多时候,我们看的指标是总体指标,而总体指标是由若干部分组成的,比如:

        总公司——分公司A、分公司B、分公司C
        总销售——商品A、商品B、商品C
        因此看到一个总体指标以后,可以根据它的组成部分,对总体做拆解,了解各部分组成,是为结构分析法(分析总体的内部结构)。

2. 结构分析法

      结构分析法在很多时候都好用,比如问:“为什么业绩下滑呀!”答:“因为XX区域没有做好!”通过看结构,能很快找到责任人。

3. 分层分析法

       除了单纯地看结构,人们也喜欢做排名,区分个高中低,这就是分层分析法。

       很多同学会把分层和结构搞混,大家只要记得以下两句:

        这三种方法,是基础中的基础。一来,它们都是在分析一个指标,二来,它们都是基于事实陈述,不需要啥计算。当我们初到一个公司,初接触一个新数据,都可以用这三种方法,建立基础认知。

三、从一个指标到2个指标

矩阵分析法

      当指标从一个增加到2个的时候,最好的方法就是矩阵分析法。矩阵分析法,通过两个指标的交叉,构造分析矩阵,利用平均值切出四个象限,从而发现问题(如下图)。

      矩阵分析法的最大优势,在于:直观易懂。可以很容易从两个指标的交叉对比中发现问题。特别是当这两个指标是投入/成本指标的时候,成本高+收入低,成本低+收入与高两个类别,能直接为业务指示出改进方向,因此极大避免了:“不知道如何评价好坏”的问题。

      很多咨询公司都喜欢用这种方法,类似KANO模型或者波士顿矩阵,本质就是找到了两个很好的评价指标,通过两指标交叉构造矩阵,对业务分类。分类的区分效果很好,就广为流传了。

四、从2个指标到多个指标

      当分析指标变得更多的时候,最重要的工作,就是弄清楚:到底这些指标是什么关系。典型的关系有两种。

1. 第一种:并列关系

      几个指标相互独立,且是上一级指标的组成部分。比如我们常说的:业绩=客户数*消费率*客单价

在这个公式里:

一级指标:业绩;
二级指标:客户数、消费率、客单价;
客户数、消费率、客单价相互独立。
此时,客户数、消费率、客单价就是并列的三个指标,并且都是业绩的子指标。

2. 第二种:串行关系

      几个指标相互关联,有前后顺序关系。比如我们常说的:新注册用户数=广告浏览人数*落地页转化率*注册页转化率。

一级指标:新注册用户数;
二级指标:广告浏览人数、落地页转化率、注册页转化率;
用户要先看到广告,再点击广告进入落地页,再完成注册。
此时,广告页、落地页、注册页的指标相互关联,用户要一步步走。

      这两种关系,分别对应两种基础分析方法:

并列关系:指标拆解法,通过拆解一个一级指标,从二级指标里发现问题。
漏斗分析法:通过观察一串流程,了解其流程转化率,发现转化率短点。

3. 指标拆解法

     指标拆解法,一般在经营分析中使用较多。举个简单的例子,一个小程序商城,上月销售业绩150万,本月120万。如果只看结果,除了少了30万以外啥也不知道。但是进行指标拆解以后,就能发现很多东西(如下图)

      拆解以后可以明显看出:本月虽然注册用户人数增加了,但是消费率大幅度降低,所以收入少了。后续可以进一步思考:如何提高消费率。

4. 漏斗分析法

       漏斗分析法,则在互联网产品/推广/运营分析中使用较多,因为互联网产品能记录较多用户数据,因此可以呈现整个用户转化流程,从而进行分析。

      举个简单例子,在网上看到一个商品广告,我们很感兴趣,点击进入购买。需要经历广告页→详情页→购物车→支付几个步骤,每多一个步骤,就会有一些用户流失,如同漏斗一样。

       有了转化漏斗以后,就能进一步基于漏斗分析,从而指导业务改善:

哪个环节漏掉的用户最多,需要改善?
不同的商品,漏斗形态如何,哪个更适合推广?
新的产品改版后,是否减少了漏掉的用户数量?

5. 相关分析法

       当然,还有一些指标,可能不是直接的并行/串行关系,但是在工作中,也很想知道他们有没有关系,比如:

广告投入与销售业绩;
下雨刮风和门店人流;
用户点击和消费行为。

      此时,需要掌握相关分析法。注意:指标之间可能天生存在相关关系。常见的天生相关,有三种形态:

在结构分析法中,整体指标与部分指标之间关系;
在指标拆解法中,主指标与子指标之间的关系;
在漏斗分析法中,前后步骤指标之间的关系。

       这三种情况,称为:直接相关。直接相关不需要数据计算,通过指标梳理就能看清楚关系。相关分析法,更多是利用散点图/相关系数,找到潜在的相关关系)。

但是要注意:相关不等于因果,到底如何解读相关系数,需要结合具体业务含义,不能胡乱下结论哦。

五、从指标到业务逻辑

1. 标签分析法

      以上所有方法,都是基于数据指标计算,但实际业务中,很多关系并不能直接用数据指标表示。比如:

是不是社区店比步行街店,生意更好?
是不是私域流量比公域流量,转化更佳?
是不是刮风下雨比晴空万里,销售更好?

      社区店/私域流量/刮风下雨,很难用一个数据指标来衡量。但这些因素,又确实会对企业经营产生影响,该怎么分析呢?这就需要采用:标签分析法。

那么可以得出结论:下雨对业绩影响不大,这就做完了。

      注意,上边的小例子里,标签做的很粗糙,只有简单粗暴的下雨/没下雨两类。除了下雨以外,还可能有台风、冰雹、高温等等情况。因此,做标签的精细程度,决定了标签分析的准确度。而能否选取到合适的标签,则考验的是分析人员对业务的理解程度。

      到这里,一共介绍了八种基础方法。在实际工作中,一般都是多种方法综合使用的。因为业务提的问题会很复杂,很有可能涉及多个指标、多个标签。此时千头万绪,要理清思路,就得祭出第九种方法:MECE法。

2. MECE法

      MECE是(Mutually Exclusive Collectively Exhaustive)的缩写,指的是“相互独立,完全穷尽”的分类原则。通过MECE方法对问题进行分类,能做到清晰准确,从而容易找到答案。

       MECE法是基础分析和高级分析的分水岭,也是从基础提升到高级的通道。所有复杂的问题,都需要经过认真的梳理和分解,才能成为一个个能解决的小问题。所谓的业务分析模型,其实就是对业务问题的MECE分解。

       当然,肯定也有同学好奇:掌握了这九种方法以后,还可以怎么深入呢?一般有三条深入路线,可以进行深入分析。

六、掌握了基础方法以后

1. 路线一:业务分析模型

        业务模型,用来解决:定义模糊、数据贫瘠、需指导业务的问题。

比如业务在纠结:

到底做什么用户更好?
到底怎样才能激励销售?
到底活动起了多大作用?

       这些问题听起来简单,其实定义非常模糊,什么算好?怎么叫起作用?不发钱的激励真的有用?各种问题错综复杂,且很有可能掺杂了业务部门自己的小心思。因此,需要细细的梳理业务逻辑,推导出可行的解题逻辑。

2. 路线二:算法分析模型

      算法模型,用来解决:定义清晰、数据丰富、计算过程复杂的问题。

      比如,高价值用户识别问题,业务上已经定义清楚了:

用什么指标衡量用户价值;
用什么标准评价价值“高”;
采集了丰富的数据(性别、年龄、兴趣、关联商品、互动、评论……);
有一批人工标注过的“高价值”用户做正样本。

      此时,可以用各种算法来建模了。建模的目的,不是为了增加分析深度,而是提高从分析到业务应用的效率。有了相对准确的模型判断,业务可以通过CDP+MA,自动触发营销规则,不需要每次都写ppt写很久。算法模型需要一些

3. 路线三:统计推断

      统计推断方法,用来解决:定义清晰、没有数据、需测试收集数据的问题。

      比如:要上一个新版本产品,业务已经定义了:新版本要提升用户的人均在线时长(均值问题),现在要做测试,从两个预备版本里选一个。此时要用:双总体均值比较假设检验的方法。

     当然,实际问题会更复杂,考虑各种控制变量,假设前提,但也考虑系统开发,数据采集方案,不仅由分析师解决。以上是数据掌握基本方法后的三条深入学习路线。

      无论是产品还是运营,在工作中都不可避免地会遇到与数据相关的场景。此时,如果我们能够掌握一些数据分析方法,它可以帮助我们更快地获取信息。那么,什么数据分析方法简单且易于掌握呢?

      “你做数据分析有啥方法论?”无论是工作还是面试,此问题一出,都会难倒一片同学。妈耶,每天照单跑数就知道,但方法论是个什么鬼!今天介绍给大家基础的九种方法,先开个头哦。

一、什么是基础方法

      从本质上看,几乎所有工作都和数据有关系,都或多或少需要一些数据分析方法。但数据本身是有门槛的,很多人上学的时候就怕数学课,更不要说复杂的理论了。因此,所谓基础数据分析方法,应该是:

      不涉及高等数学、统计学、运筹学、算法原理;
      不涉及复杂的业务逻辑、因果推断逻辑;
      不局限于特定的业务场景,有普适性。
      总之,人人能用的,才是基础方法。

      基于这个理念,我们为大家整理了九种基础分析方法,简单又好用。

二、从一个指标开始

1. 周期性分析法

      最基础的分析方法,可以从一个指标开始,这就是“周期性分析法”。

       所谓“周期性分析法”,操作上非常简单,就是把一个指标的观察时间拉长,看它是否有周期变化规律。

      这种方法分析简单,但是非常实用。因为新手经常因为不懂看周期变化,引发笑话。诸如:

      “我发现昨天指标大跌”——昨天是周末,本来就该跌(自然周期变化)
      “我发现A产品卖得很好”——A产品刚上市,它就该卖得好(产品生命周期)

      很多时候,我们看的指标是总体指标,而总体指标是由若干部分组成的,比如:

        总公司——分公司A、分公司B、分公司C
        总销售——商品A、商品B、商品C
        因此看到一个总体指标以后,可以根据它的组成部分,对总体做拆解,了解各部分组成,是为结构分析法(分析总体的内部结构)。

2. 结构分析法

      结构分析法在很多时候都好用,比如问:“为什么业绩下滑呀!”答:“因为XX区域没有做好!”通过看结构,能很快找到责任人。

3. 分层分析法

       除了单纯地看结构,人们也喜欢做排名,区分个高中低,这就是分层分析法。

       很多同学会把分层和结构搞混,大家只要记得以下两句:

        这三种方法,是基础中的基础。一来,它们都是在分析一个指标,二来,它们都是基于事实陈述,不需要啥计算。当我们初到一个公司,初接触一个新数据,都可以用这三种方法,建立基础认知。

三、从一个指标到2个指标

矩阵分析法

      当指标从一个增加到2个的时候,最好的方法就是矩阵分析法。矩阵分析法,通过两个指标的交叉,构造分析矩阵,利用平均值切出四个象限,从而发现问题(如下图)。

      矩阵分析法的最大优势,在于:直观易懂。可以很容易从两个指标的交叉对比中发现问题。特别是当这两个指标是投入/成本指标的时候,成本高+收入低,成本低+收入与高两个类别,能直接为业务指示出改进方向,因此极大避免了:“不知道如何评价好坏”的问题。

      很多咨询公司都喜欢用这种方法,类似KANO模型或者波士顿矩阵,本质就是找到了两个很好的评价指标,通过两指标交叉构造矩阵,对业务分类。分类的区分效果很好,就广为流传了。

四、从2个指标到多个指标

      当分析指标变得更多的时候,最重要的工作,就是弄清楚:到底这些指标是什么关系。典型的关系有两种。

1. 第一种:并列关系

      几个指标相互独立,且是上一级指标的组成部分。比如我们常说的:业绩=客户数*消费率*客单价

在这个公式里:

一级指标:业绩;
二级指标:客户数、消费率、客单价;
客户数、消费率、客单价相互独立。
此时,客户数、消费率、客单价就是并列的三个指标,并且都是业绩的子指标。

2. 第二种:串行关系

      几个指标相互关联,有前后顺序关系。比如我们常说的:新注册用户数=广告浏览人数*落地页转化率*注册页转化率。

一级指标:新注册用户数;
二级指标:广告浏览人数、落地页转化率、注册页转化率;
用户要先看到广告,再点击广告进入落地页,再完成注册。
此时,广告页、落地页、注册页的指标相互关联,用户要一步步走。

      这两种关系,分别对应两种基础分析方法:

并列关系:指标拆解法,通过拆解一个一级指标,从二级指标里发现问题。
漏斗分析法:通过观察一串流程,了解其流程转化率,发现转化率短点。

3. 指标拆解法

     指标拆解法,一般在经营分析中使用较多。举个简单的例子,一个小程序商城,上月销售业绩150万,本月120万。如果只看结果,除了少了30万以外啥也不知道。但是进行指标拆解以后,就能发现很多东西(如下图)

      拆解以后可以明显看出:本月虽然注册用户人数增加了,但是消费率大幅度降低,所以收入少了。后续可以进一步思考:如何提高消费率。

4. 漏斗分析法

       漏斗分析法,则在互联网产品/推广/运营分析中使用较多,因为互联网产品能记录较多用户数据,因此可以呈现整个用户转化流程,从而进行分析。

      举个简单例子,在网上看到一个商品广告,我们很感兴趣,点击进入购买。需要经历广告页→详情页→购物车→支付几个步骤,每多一个步骤,就会有一些用户流失,如同漏斗一样。

       有了转化漏斗以后,就能进一步基于漏斗分析,从而指导业务改善:

哪个环节漏掉的用户最多,需要改善?
不同的商品,漏斗形态如何,哪个更适合推广?
新的产品改版后,是否减少了漏掉的用户数量?

5. 相关分析法

       当然,还有一些指标,可能不是直接的并行/串行关系,但是在工作中,也很想知道他们有没有关系,比如:

广告投入与销售业绩;
下雨刮风和门店人流;
用户点击和消费行为。

      此时,需要掌握相关分析法。注意:指标之间可能天生存在相关关系。常见的天生相关,有三种形态:

在结构分析法中,整体指标与部分指标之间关系;
在指标拆解法中,主指标与子指标之间的关系;
在漏斗分析法中,前后步骤指标之间的关系。

       这三种情况,称为:直接相关。直接相关不需要数据计算,通过指标梳理就能看清楚关系。相关分析法,更多是利用散点图/相关系数,找到潜在的相关关系)。

但是要注意:相关不等于因果,到底如何解读相关系数,需要结合具体业务含义,不能胡乱下结论哦。

五、从指标到业务逻辑

1. 标签分析法

      以上所有方法,都是基于数据指标计算,但实际业务中,很多关系并不能直接用数据指标表示。比如:

是不是社区店比步行街店,生意更好?
是不是私域流量比公域流量,转化更佳?
是不是刮风下雨比晴空万里,销售更好?

      社区店/私域流量/刮风下雨,很难用一个数据指标来衡量。但这些因素,又确实会对企业经营产生影响,该怎么分析呢?这就需要采用:标签分析法。

那么可以得出结论:下雨对业绩影响不大,这就做完了。

      注意,上边的小例子里,标签做的很粗糙,只有简单粗暴的下雨/没下雨两类。除了下雨以外,还可能有台风、冰雹、高温等等情况。因此,做标签的精细程度,决定了标签分析的准确度。而能否选取到合适的标签,则考验的是分析人员对业务的理解程度。

      到这里,一共介绍了八种基础方法。在实际工作中,一般都是多种方法综合使用的。因为业务提的问题会很复杂,很有可能涉及多个指标、多个标签。此时千头万绪,要理清思路,就得祭出第九种方法:MECE法。

2. MECE法

      MECE是(Mutually Exclusive Collectively Exhaustive)的缩写,指的是“相互独立,完全穷尽”的分类原则。通过MECE方法对问题进行分类,能做到清晰准确,从而容易找到答案。

       MECE法是基础分析和高级分析的分水岭,也是从基础提升到高级的通道。所有复杂的问题,都需要经过认真的梳理和分解,才能成为一个个能解决的小问题。所谓的业务分析模型,其实就是对业务问题的MECE分解。

       当然,肯定也有同学好奇:掌握了这九种方法以后,还可以怎么深入呢?一般有三条深入路线,可以进行深入分析。

六、掌握了基础方法以后

1. 路线一:业务分析模型

        业务模型,用来解决:定义模糊、数据贫瘠、需指导业务的问题。

比如业务在纠结:

到底做什么用户更好?
到底怎样才能激励销售?
到底活动起了多大作用?

       这些问题听起来简单,其实定义非常模糊,什么算好?怎么叫起作用?不发钱的激励真的有用?各种问题错综复杂,且很有可能掺杂了业务部门自己的小心思。因此,需要细细的梳理业务逻辑,推导出可行的解题逻辑。

2. 路线二:算法分析模型

      算法模型,用来解决:定义清晰、数据丰富、计算过程复杂的问题。

      比如,高价值用户识别问题,业务上已经定义清楚了:

用什么指标衡量用户价值;
用什么标准评价价值“高”;
采集了丰富的数据(性别、年龄、兴趣、关联商品、互动、评论……);
有一批人工标注过的“高价值”用户做正样本。

      此时,可以用各种算法来建模了。建模的目的,不是为了增加分析深度,而是提高从分析到业务应用的效率。有了相对准确的模型判断,业务可以通过CDP+MA,自动触发营销规则,不需要每次都写ppt写很久。算法模型需要一些

3. 路线三:统计推断

      统计推断方法,用来解决:定义清晰、没有数据、需测试收集数据的问题。

      比如:要上一个新版本产品,业务已经定义了:新版本要提升用户的人均在线时长(均值问题),现在要做测试,从两个预备版本里选一个。此时要用:双总体均值比较假设检验的方法。

     当然,实际问题会更复杂,考虑各种控制变量,假设前提,但也考虑系统开发,数据采集方案,不仅由分析师解决。以上是数据掌握基本方法后的三条深入学习路线。以上文章内容就是小编为您介绍的数据分析的几种基础方法。

[免责声明]

文章标题: 数据分析的几种基础方法

文章内容为网站编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时沟通。发送邮件至36dianping@36kr.com,我们会在3个工作日内处理。

消息通知
咨询入驻
商务合作