多元回归分析步骤,逐步多元回归分析操作步骤

首页 > 教育 > 作者:YD1662024-06-12 08:31:17

从上表可以看出,初始工资、教育程度与工作经验三个自变量对应t检验的p值均小于0.05,呈现出显著性特征。说明三个自变量X对因变量Y(工资)均呈现出显著性。

多元线性回归分析同时会输出一些其他的指标,接下来将逐个进行说明。

四、其他指标解读

(1)VIF值

VIF值用于共线性判断,共线性是指在线性回归分析时,出现的自变量之间彼此相关的现象。共线性出现的原因可能是由于多个自变量之间本身就存在很强的相关关系;或者由于收集的样本量不足;再或者由于在回归分析时错误的使用虚拟变量等都可能导致共线性问题的出现。

使用SPSSAU进行多元线性回归时,分析结果会自动输出VIF值,用来判断是否存在共线性。一般VIF值大于10(严格大于5),则认为存在严重的共线性。SPSSAU输出结果如下:

多元回归分析步骤,逐步多元回归分析操作步骤(9)

从上表可以看出,VIF值均小于10,说明不存在共线性问题。但有些文献要求VIF值小于5才认为不存在共线性问题,严格来看,工作经验的VIF=6.76>5,说明可能存在一定的共线性问题。如果认为数据存在共线性,可以手动移除相关性非常高的变量,或者改用逐步回归、岭回归等方法进行分析。此处认为共线性可以忽略,故不再进行赘述。

(2)R方与调整后R方

R方用于分析模型的拟合优度,又称决定系数。R方的值介于0~1之间,代表模型的拟合程度,一般认为越大越好。例如R方为0.5,说明自变量可以解释因变量50%的变化原因。但是实际研究中并不会过多关注R方的大小,因为进行回归分析更多的主要关注自变量对因变量是否具有影响关系。调整后R方并没有实际意义,通常在进行模型调整(增加或者减少变量个数时)使用,用于判断你的模型中该不该加入你想加入的变量。

SPSSAU输出结果如下图:

多元回归分析步骤,逐步多元回归分析操作步骤(10)

从上表可以看出,R方=0.973,说明自变量可以解释因变量97.3%的变化原因,模型拟合较好。当进行模型调整时,可以关注调整后R方的变化。

(3)D-W值

模型的随机干扰项相互独立或不相关,是多元线性回归模型的基本假设之一。随机干扰项是数据本身的不确定性带来的误差。如果模型的随机干扰项违背了相互独立的基本假设,称为存在自相关性。自相关性可以使用D-W检验进行分析。

D-W检验(杜宾-瓦特森检验),计量经济,统计分析中常用的一种检验序列一阶自相关最常用的方法。SPSSAU在进行线性回归分析时,输出D-W值如下:

多元回归分析步骤,逐步多元回归分析操作步骤(11)

一般认为,如果D-W值在2附近(1.7~2.3之间),说明不存在自相关性,模型构建比较好,反之如果D-W值明显偏离2,说明模型具有自相关性,模型构建较差。

从上表得到,本次分析的D-W值=0.438,明显偏离2,说明模型存在自相关性,模型构建较差。但是由于一般对于时间序列分析才会考虑DW值,本次分析数据并非时间序列,所以暂且忽略自相关性。如果在分析时需要自相关问题修正,可以使用广义差分法,在此不再进行深入分析。

(4)残差

在进行分析时,如果有需要,可以选择勾选【保存预测和残差值】选项,SPSSAU会输出残差值和预测值。

针对残差值,一般会检验残差值的正态性。如果残差直观上满足正态性,说明模型构建较好,反之说明模型构建较差。SPSSAU利用残差绘制直方图,得到结果如下:

多元回归分析步骤,逐步多元回归分析操作步骤(12)

上一页1234下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.