主成分分析法怎么写结果,主成分分析法的步骤和技巧

首页 > 教育 > 作者:YD1662024-05-08 16:33:16

如果我们按降序对特征值进行排序,则得到λ1>λ2,这意味着与第一主成分(PC1)对应的特征向量是v1,而与第二成分(PC2)对应的特征向量是v2。

在有了主成分之后,为了计算每个成分所占的方差(信息)百分比,我们将每个成分的特征值除以特征值的总和。如果我们把这个计算法应用到上面的例子中,我们会发现,PC1和PC2分别携带了96%和4%的数据方差。

第4步:特征向量

正如我们在上一步中所看到的,计算特征向量并按其特征值依降序排列,使我们能够按重要性顺序找到主成分。在这个步骤中我们要做的,是选择保留所有成分还是丢弃那些重要性较低的成分(低特征值),并与其他成分形成一个向量矩阵,我们称之为特征向量。

因此,特征向量只是一个矩阵,其中包含我们决定保留的成分的特征向量作为列。这是降维的第一步,因为如果我们选择只保留n个特征向量(分量)中的p个,则最终数据集将只有p维。

举例:

接着上一步的例子,我们可以用v1或v2向量来形成一个特征向量。

主成分分析法怎么写结果,主成分分析法的步骤和技巧(9)

或者丢弃重要性较小的向量v2,仅用v1形成一个特征向量。

主成分分析法怎么写结果,主成分分析法的步骤和技巧(10)

丢弃特征向量v2将使维数减少1,并且将导致最终数据集中的信息丢失。 但鉴于v2仅携带4%的信息,因此损失并不重要,我们仍将拥有v1所携带的96%的信息。

因此,正如我们在例子中看到的那样,你可以选择是保留所有成分还是丢弃不重要的成分,具体取决于你要查找的内容。如果你不追求降维,只是想利用不相关的新变量(主成分)描述你的数据,则不需要保留重要性较次的成分。

最后一步:沿主成分轴重新绘制数据

在前面的步骤中,除了标准化之外,你不需要更改任何数据,只需选择主成分,形成特征向量,但输入数据集时要始终与原始轴统一(即初始变量)。

这一步,也是最后一步,目标是使用协方差矩阵的特征向量去形成新特征向量,将数据从原始轴重新定位到由主成分轴中(因此称为主成分分析)。这可以通过将原始数据集的转置乘以特征向量的转置来完成。

主成分分析法怎么写结果,主成分分析法的步骤和技巧(11)

上一页123末页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.