主成分分析有几种方法,对主成分分析方法的理解

首页 > 教育 > 作者:YD1662024-05-08 16:42:04

主成分分析有几种方法,对主成分分析方法的理解(1)

主成分分析(英语:Principal components analysis,PCA)是一种分析、简化数据集的技术。


通过降维技术把多个变量化为少数几个主成分(综合变量)的统计分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。


主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。


主成分分析由卡尔•皮尔逊于1901年发明,用于分析数据及建立数理模型。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(即特征向量)与它们的权值(即特征值)。


主成分的目的:


(1)变量的降维
(2)主成分的解释(在主成分有意义的情况下)


主成分分析法从冗余特征中提取主要成分,在不太损失模型质量的情况下,提升了模型训练速度。


主成分分析有几种方法,对主成分分析方法的理解(2)


如上图所示,我们将样本到红色向量的距离称作是投影误差(Projection Error)。以二维投影到一维为例,PCA 就是要找寻一条直线,使得各个特征的投影误差足够小,这样才能尽可能的保留原特征具有的信息。因为PCA仅保留了特征的主成分,所以PCA是一种有损的压缩方式.


PCA分析的一般步骤


1.根据研究问题选取初始分析变量


2.根据初始变量特性判断由协方差阵求主成分还是由相关矩阵求主成分;


3.求协方差阵或相关阵的特征值与相应标准特征向量;


4.判断是否存在明显的多重共线性,若存在,则回到第(1)步;


5.得到主成分的表达式并确定主成分个数,选取主成分;


6.结合主成分对研究问题进行分析并深入研究。


PCA的目标是用一组较少的不相关变量代替大量相关变量,同时尽可能保留初始变量的信息,这些推导所得的变量称为主成分,它们是观测变量的线性组合。


主成分分析法优缺点


优点

↘可消除评估指标之间的相关影响。因为主成分分析法在对原始数据指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标间相关程度越高,主成分分析效果越好。


↘可减少指标选择的工作量,对于其他评估方法,由于难以消除评估指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析法由于可以消除这种相关影响,所以在指标选择上相对容易些。


↘主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前面方差较大的几个主成分来代表原变量,从而减少了计算工作量。用主成分分析法作综合评估时,由于选择的原则是累计贡献率≥85%,不至于因为节省了工作量却把关键指标漏掉而影响评估结果。


缺点

↘在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。


↘主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。


↘当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确。


主成分分析案例


某公司经理拟招聘一名员工,要求其具有较高的工作积极性、自主性、热情和责任感。为此,该经理专门设计了一个测试问卷,配有25项相关问题,拟从315位应聘者中寻找出最合适的候选人。


在这25项相关问题中:


↘Qu3-Qu8、Qu12、Qu13测量的是工作积极性


↘Qu2、Qu14-Qu19测量工作自主性


↘Qu20-Qu25测量的是工作热情


↘Qu1、Qu9-Qu11测量工作责任感


每一个问题都有非常同意“Agree”、同意 “Agree Some”、不确定“Undecided”、不同意 “Disagree Some”和 非常不同意 “Disagree”五个等级。


该经理想根据这25项问题判断应聘者在这四个方面的能力,现收集了应聘者的问卷信息,经汇总整理后部分数据如下:


主成分分析有几种方法,对主成分分析方法的理解(3)


分析者希望将多个变量归纳为某几项信息进行分析,即降低数据结果的维度。针对这种情况,可以进行主成分提取,但需要先满足2项假设:


↘假设1:观测变量是连续变量或有序分类变量,如本研究中的测量变量都是有序分类变量。


↘假设2:变量之间存在线性相关关系。


SPSS操作

SPSS操作


(1) 在主页面点击Analyze→Dimension Reduction →Factor


主成分分析有几种方法,对主成分分析方法的理解(4)

首页 12345下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.