我们常用的数据分析方法有哪些?——本文,将为大家逐一讲解
而这些方法,具体怎么使用?——我们将在接下来的文章,逐一为大家介绍
先来给大家介绍下,本节将会概述的分析方法,共11种方法,分别为:1.描述分析法
2.对比分析法
3.平均分析法
4.分组分析法
5.结构分析法
6.回归分析法
7.交叉分析法
8.相关分析法
9.预测分析法
10.量化分析法
11.象限分析法
以下,是概述讲解:
1
描述分析法
是最基础的分析方法之一,主要通过分析频数、集中趋势、离散程度和分布形态等,并加以图表进行呈现
以下是所涵盖的细分分析:
频数分析:
频数:个数、次数
百分比:频数/总频数
集中趋势:
平均值:总和/总计
中位数:处于中间位置的数值
众数:出现次数最多的数值
离散程度:
最大值:最大的数值
最小值:最小的数值
四分位数:将数值从小到大排序,依据等距划分为四份,处于三个分割点的数值
方差:各数值与算术平均数之差平方和的均值
标准差:方差开平方
分布形态:
偏度:倾斜方向和程度
正态分布:随机变量X服从数学期望为μ、方差为σ^2的分布
正偏态:众数>中位数>算术平均数
负偏态:算术平均数>中位数>众数
峰度:平均值所处的峰值高低,反映峰度尖度
2
平均分析法
也是最基础的分析方法之一,是利用特征数据的平均指标,反映事物发展水平的分析方法
其中,平均指标有“数值平均数”和“位置平均数”;
数值平均数有:算术平均数、加权平均数和简单几何平均数
位置平均数有:中位数和众数
以下是平均指标具体计算方法:
数值平均数:
算术平均数 = 总和/计数
加权平均数 = 数值*权数之和/单位数之和
简单几何平均数 = N个数值相乘的N次方根
位置平均数:
中位数:先对数据进行排序,若数据为奇数项,则为中间位置的数值;若数据为偶数项,则为中间两数值的算术平均数
众数:为出现次数最多的数值;有时,会出现多个众数
3
对比分析法
亦称对比法、比较分析法,是指将数据与不同基数进行横向、纵向对比,了解数据差异,掌握事物发展趋势、变化规律等的分析方法
横向对比:为平级事物间的对比,如目标、部门、单位、地区、行业等的对比
纵向对比:为不同时期、阶段间的对比,如同比、环比、阶段前后对比
请注意,对比之前,需确保各数据间具有可比性,即:
统计基数是否相同
统计口径是否一致
指标类型是否相同
计量单位是否相同
......
4
分组分析法
是指依据数据的属性、特征,将数据划分为不同类型、组别,进行分析的分析方法
一般地,可分为两种分组分析法,为“按属性指标分组”和“按数量指标分组”
(1)按属性指标分组:
有两种细分分组方式,为“按自然属性分组”和“按社会属性分组”
按自然属性分组:
主要依据自然属性进行分组,如性别、血型等
按社会属性分组:
主要依据社会属性进行分组,如学历、地区、机型等
(2)按数量指标分组:
主要依据数据是否离散、数据量大小和变化幅度等进行分组,可分为“单项式分组”和“组距式分组”
单项式分组:
一般针对离散型,且数量不多、变动小的数据
依据不同的指标值,将数据划分为不同的组,如年份、职级等
组距式分组:
一般针对数据量大、变化幅度较大的数据
依据组距,将数据划分为不同的组,如消费能力、薪资水平等
5
结构分析法
是指对数据进行分类后,对比各项在整体中的占比,进而判断结构特征、变化趋势的分析方法
主要为“静态”和“动态”分析:
静态分析:
为短期分析,指某时期、时段,结构特征、变化趋势的分析,如,产业结构季度分析
动态分析:
为长期分析,指不同时期,结构特征、变化趋势的分析,如,为期5-10年的产业结构分析
6
回归分析法
亦称线性回归分析法,是利用线性回归模型,判断因变量与自变量,是否成线性相关关系的分析方法
一般来说,若数据点平均分布在一条直线附近,则因变量与自变量成线性相关关系
若没有平均分布在一条直线附近,则因变量与自变量不成线性相关关系
如何判断是否成线性相关关系:
散点图:数据点是否平均分布在一条直线附近?
残差:是否服从正态分布?
显著性检验:P值是否处于0-0.05之间?
几元回归:
若线性回归分析中,只有一个自变量,则为一元线性回归
若有两个及以上的自变量,则为多元线性回归
7
交叉分析法
亦称相关交叉分析法,属于相关分析
是分析两个及以上的变量之间,是否存在相关性及强弱程度,进而制定,或调整策略、方案等的分析方法
请注意,在进行交叉分析时,需要分两种情况进行讨论:
第1种情况:
若两者本应存在线性相关关系,则先进行线性回归分析,再进行交叉分析
第2种情况:
若两者不应存在线性相关关系,则直接进行交叉分析
同时,可利用Excel、Python、SPSS等工具进行分析
8
相关分析法
回归分析及交叉分析,都属于相关分析
这里,我们再赘述一遍,在进行相关分析时,需要分两种情况进行讨论:
若两变量本应存在线性相关关系,则先进行回归分析,再进行交叉分析
若两变量不应存在线性相关关系,则直接进行交叉分析
接着,我们可以依据相关性大小、正负等,判断是否相关及程度等
9
预测分析法
是依据现有数据,对未来进行估算,推断未来发展趋势的分析方法
一般来说,可调用多种方法进行预测,如:
依据线性回归建模结果,构造逻辑回归公式进行预测
同时,可利用时间序列模型进行预测
再者,可利用Market Sizing进行估算
10
量化分析法
是指将非数值化的数据,转化为可比较的数据,再进行分析,为各类业务、生活等场景提供策略支持的分析过程
主要涉及两个因素:维度和权重
11
象限分析法
简称象限法,亦称矩阵关联分析法,是主要依据事物的重要属性,将数据划分到不同象限,针对不同象限,采取不同的策略应对的分析方法
其中,重要属性有:重要程度、紧急程度、转化、金钱、频率、间隔等
而常见的象限法应用有:RFM用户分群、工作主次梳理等
以上是11种常用的数据分析方法概述,接下来,我们将逐一、详细地为大家介绍这些分析方法的应用,我们下期见