常用的统计分析方法,统计分析学的基本方法

首页 > 教育 > 作者:YD1662024-05-15 22:41:07

工作中主要应用场景如下:

常用的统计分析方法,统计分析学的基本方法(13)

08 判别分析「常用指数:4星」

判别分析(分类问题),通过研究对象的特征判断所属的类别。与聚类分析的差异在于,聚类分析在分析前,不知道类别有几类以及是什么,而判别分析是在总体类别已知的情况下,对新样本判断所属群体。

涵盖内容如下:

常用的统计分析方法,统计分析学的基本方法(14)

工作中主要应用场景如下:

常用的统计分析方法,统计分析学的基本方法(15)

09 主成分分析「常用指数:2星」

主成分分析(Principal Component Analysis,PCA),是将一组可能的相关性变量,转化成为一组线性不相关的变量,转化后的这组变量叫做主成分。

主成分分析最大的作用在于「降维」,也可用于「探索变量之间的关系」。简单解释一下,在搭建模型过程中,往往会选择诸多变量作为特征,而这些变量之间也往往存在着相关性,这会引起「多重共线性问题」。因此,需要一种方式,将这些变量转化为相对独立且尽可能多的涵盖原始变量的信息,主成分则是其中的一种方式,将原始变量转化为几个相互无关的新变量。

扫盲 - 多重共线性问题 自变量(特征)之间由于存在相关关系,从而使得模型估计失真 (结果不稳定,例如:随机森林特征贡献度,多次运行出来的结果差异较大)。10 因子分析「常用指数:2星」

因子分析的作用同主成分分析一样,同样是为了「降维」。原理是在多自变量之间,寻找潜在的因子,相似变量归为一个因子,通过因子替代原有的自变量。

与主成分分析相同之处:起到清理原始自变量中内在关系的作用。

与主成分分析不同之处:主成分分析重在归总变量的信息,而因子分析重在解释变量的信息,主成分分析是因子分析的子集。

以上10种统计学方法在工作中较为常见,但方式不止于此,还包括:信度分析、生存分析、多重响应分析、距离分析等。有待你在工作中不断探索、发掘场景,并将知识应用其中。


以上就是本期的内容分享

如果你也对数据分析感兴趣,那就来关注我吧,更多「原创」文章,与你分享!!

*小火龙说数据

上一页1234末页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.