Factor Analysis,因子分析最早由心理学家提出,是多元统计的重要分析方法之一,其基本思想是根据相关性大小对变量进行分组,使得同组内的变量之间相关性较高,不同组的变量之间相关性较低,每组变量代表了一个基本结构,因子分析中将之称为公共因子。
因子分析(Factor Analysis)基本作用?(1)降维;
(2)发现变量间潜在关系(因子)。
因子分析分类(方向)?(1)探索性因子分析(exploratory factor analysis)。
(2)验证性因子分析(confirmatory factoranalysis)。
探索性因子分析是不确定一堆自变量背后有几个因子,我们通过这种方法试图寻找到因子。而验证性因子分析是已经假设自变量背后有几个因子,试图通过这种方法去验证一下这种假设是否正确。验证性因子分析又和结构方程模型有很大关系。
说明:
有关因子分析的数学模型推导,在此就不做推导了,感兴趣的可以自己在网上查阅有关因子分析的数据模型推导过程。
安装factor_analyzer开始/运行:cmd
pip install factor_analyzer
引入库读入数据import pandas as pd
import numpy as np
import numpy.linalg as nlg
from pandas import DataFrame
from factor_analyzer import FactorAnalyzer, Rotator, calculate_kmo, calculate_bartlett_sphericity
df_features = pd.read_csv('test11.csv')
rows*columns:1000*8