4. 第四步:做因子分析
调用因子分析函数,并得到因子载荷矩阵;从载荷矩阵可以看到,第一个因子和收入、有房家庭比例、复员军人比例及欧裔比例成正相关;第二个因子和非裔比例成正相关,反而和收入及有房比例等成负相关。
fa = FactorAnalyzer(2, rotation=”varimax”)fa.fit(LA_data_final_feat)# 输出载荷矩阵df_loading=pd.DataFrame(fa.loadings_,index=LA_data_final_feat.columns.tolist)df_loading
5. 第五步:计算因子得分
其中因子1得分越大表示:收入、有房家庭比例、复员军人比例及欧裔比例更高;因子2得分高表示:非裔人群比例更高。
综上,以上就是本文要介绍的全部内容。
因子分析在互联网数据分析场景下用到的比较少,主要原因就是很多人不知道怎么用?不知道用到哪里?希望看完文章的你能初步了解因子分析,能知道下面几个问题的答案(不记得就回头看上面的介绍分享哦)。
- 什么是因子分析?
- 因子分析可以解决什么问题?
- 因子分析的算法逻辑和分析流程是什么?
- Python代码如何实现?
作者:须臾即永恒;公众号:须臾即永恒;
本文由 @须臾即永恒 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议