因子分析两类权重计算方法总结
一、案例背景疫情爆发以来,越来越多的人为了避免线下与人接触,选择了线上购买生活必需品。网购虽然方便快捷,但是随着订单压力的增加,物流问题也随之出现,近期有很多卖家收到物流投诉的问题。淘宝某网店想要使用因子分析研究物流服务质量不同维度所占权重的情况,采用随单进行问卷调查的方式,共收集到200份数据,其中14个项调查数据可分为可靠性、经济性、时间性、灵活性4个维度。具体维度划分见下表:
二、前期准备在使用因子分析计算权重的前期,需要按照因子分析的流程完成因子分析适用性判断、对应关系调整以及因子命名这3项准备工作。
(1)因子分析适用性判断
因子分析适用性通过KMO值和Bartlett球形度检验进行判断;KMO值是一个用于检验是否适合因子分析的指标,一般大于0.6即说明数据适合进行因子分析。Bartlett球形度检验对应的p值小于0.05则说明适合进行因子分析。
(2)对应关系调整
分析14个指标与因子的对应关系;如果对应关系与预期4个维度基本一致,比如经过因子分析后隶属于“可靠性”这一维度的三个指标“包装完好”、“信息保密”、“退货包运费”确实属于“可靠性”这一维度,则说明对应关系良好;否则,则说明指标与因子对应关系需要进行调整。当指标与因子对应关系出现严重偏差的时候可以将指标做删除处理。关于对应关系调整这一部分内容,不是本篇文章讲解的重点内容,可以参考SPSSAU帮助手册进行学习https://spssau.com/helps/advancedmethods/factor.html。
(3)因子命名
在第二步指标项与因子对应关系调整好之后,就可以结合专业知识,对信息浓缩完成的4个因子进行因子命名。比如,“运费合理”、“个性化服务”、“退换货费用”、“误差处理”这四个指标可以代表物流服务的价格是否经济合理,那么就可以将提取出的因子命名为“经济性”。本案例在初始阶段已经预设将指标项分为可靠性、经济性、时间性、灵活性四个维度。
三、因子权重计算
因子权重计算是指经过因子分析后,信息浓缩为几个因子,要计算这几个因子的权重大小,即各个因子所占比重的大小。比如在本案例中,因子权重计算是指计算“可靠性”、“经济性”、“时间性”、“灵活性”这四个维度的权重值。因子权重计算主要利用下图所示表格进行计算,如下图:
(1)基本概念
1特征根:
特征根在因子分析中被用来解释因子的总贡献,特征根越大,说明因子越重要。特征根一般还可用于自动确定因子最佳个数,通常以大于1作为标准(多数情况自行设置因子个数)。
2方差解释率
方差解释率是因子提取的信息量;方差解释率=特征根/总分析项个数。比如上图中因子1的方差解释率=7.910/13=0.6084,意味着该因子共提取出这13个分析项60.845%的信息。
3累计方差解释率
因子累计提取出的信息量
4最大方差旋转法
最大方差旋转法是一种因子分析旋转方法,它的目标是使每个因子的方差尽可能大。这种方法的基本思想是将每个因子的载荷矩阵进行调整,使得每个因子的方差尽可能大。
5旋转后方差解释率
经过最大方差旋转后因子的方差解释率。使用旋转后方差解释率,可以提高分析的准确性和可解释性。
(2)计算原理
因子权重计算主要使用旋转后方差解释率和旋转后累计方差解释率进行计算。因为在经过因子旋转后,更有利于应用现实语言描述所得因子,使公共因子更具有实际意义。可以更突出各个因子的典型代表变量是谁,这样更容易发觉因子的作用。旋转的目的是通过改变坐标轴位置,重新分配各个因子所解释方差比例,使其载荷系数更接近1或0,能更好地解释和命名变量。旋转后的因子不改变模型对数据的拟合程度,也不改变各个变量的公因子方差,使因子结构变得更简单。所以,使用旋转后方差解释率可以提高因子分析的可解释性。
(3)计算示例
从上表可知:4个因子旋转后的方差解释率分别是33.530%,32.248%,12.046%,10.571%,旋转后累积方差解释率为88.395%。旋转后方差解释率归一化,可以得到4个因子的权重,计算如下:
因子1(时间性)权重=33.530% / 88.395%=0.379
因子2(经济性)权重=32.248% / 88.395%=0.365
因子3(灵活性)权重=12.046% / 88.395%=0.136
因子4(可靠性)权重=10.571% / 88.395%=0.120
计算得到,关于该淘宝网店物流服务质量研究的四个维度:时间性、经济性、灵活性、可靠性的权重分别是0.379、0.365、0.136、0.120。
四、指标权重计算
因子权重计算完成后,还可以进行指标项权重计算。指标权重计算是指,所有指标项所占权重。比如在本例中“包装完好”、“信息保密”“退换货保障”等14个指标项各自所占的权重。或者可以将因子权重理解为一级指标权重,将指标权重理解为二级指标权重。计算指标权重,主要使用到两个指标,分别是线性组合系数和综合得分系数,下面将逐个进行说明。
(1)线性组合系数
线性组合系数可用于表述信息浓缩的大小,计算线性组合系数,公式为:loading矩阵/Sqrt(eigen),即载荷系数除以对应特征根的平方根。
(2)综合得分系数
综合得分系数可用于衡量指标所占信息比重的大小,综合得分系数越大,说明指标所携带信息越大,指标权重越大。计算综合得分系数,公式为:累积(线性组合系数*方差解释率)/累积方差解释率,即线性组合系数分别与方差解释率相乘后累加,然后除以累积方差解释率;
如上图:可靠性1综合得分系数=(0.0898*33.53% 0.2706*32.25% 0.0951*12.05% 0.6573*10.57%)/(33.53% 32.25% 12.05% 10.57)=0.2244
(3)计算示例
计算指标权重,将综合得分系数进行归一化处理即得到各指标权重值;
如上图:可靠性1权重=(0.2244/∑综合得分系数)*100%=7.54%
可靠性2权重=(0.2340/∑综合得分系数)*100%=7.86%
其他指标权重计算过程同上。
注:上述loading矩阵,特征根eigen,方差解释率或累积方差解释率均为旋转后对应值
五、总结
因子权重计算与指标权重计算都可以通过SPSSAU因子分析输出的结果进行计算。因子权重使用旋转后方差解释率以及旋转后累计方差解释率进行计算;指标项权重使用归一化综合得分系数进行计算。虽然指标项计算过程略显复杂,但SPSSAU会在线性组合系数及权重结果这张表中自动输出权重值,大大简化了手动计算的繁琐步骤。
如果使用了因子分析计算因子权重后,不想再使用因子分析计算指标项权重,那么可以使用其他权重计算方法进行指标项权重的计算。例如,可以使用熵值法进行指标项权重计算,那么这里就使用了因子分析与熵值法两种计算权重的方法,可以丰富研究方法。