从直方图可以看出,数据呈现出的分布并不对称,但是从形状来看,直方图近似呈现“中间高,两头低”的钟形分布形状,说明数据为可接受的正态分布。即说明残差符合正态分布,模型构建较好。如果残差正态性非常糟糕,建议重新构建模型,比如对因变量Y取对数后再次构建模型等。
以上指标分析完成后,最后进行归回分析结果解读,判断哪些自变量对因变量有显著影响,影响方向、影响大小是怎样的;构建回归分析模型。
五、回归分析模型SPSSAU输出回归分析结果如下:
(1)模型公式
从上表可以看出,以初始工资、教育程度、工作经验为自变量,工资为因变量进行多元线性回归分析,得到回归模型公式为:工资=18326.101 0.353*初始工资-280.300*教育程度 144.955*工作经验。
特别提示:构建回归模型使用非标准化回归系数,它是方程中不同自变量对应的原始回归系数,反映了在其他自变量不变的情况下,该自变量每变化一个单位对因变量作用的大小。通过非标准化回归系数构建的回归方程,才可以对因变量进行预测。
(2)影响大小比较
自变量对因变量影响大小的比较是通过标准化回归系数进行比较的。标准化回归系数的绝对值越大,说明该自变量对因变量的影响越大。
标准化回归系数,是对自变量和因变量同时进行标准化处理后所得到的回归系数,数据经过标准化处理后消除了量纲、数量级等差异的影响,是的不同变量之间具有可比性,因此使用标准化回归系数比较不同自变量对因变量的影响大小。
从线性回归结果可以看出,初始工资、教育程度、工作经验的标准化回归系数分别是:0.168、-0.046、0.881;所以工作经验对工资的影响最大,其次是初始工资,影响最小的是教育程度,且初始工资与工作经验对工资的影响是显著正向的,而教育程度对工资的影响是显著负向的。
(3)coefPlot
SPSSAU会输出coefPlot图,用于展示具体的回归系数值和对应的置信区间,可直观查看数据的显著性情况,如果说置信区间包括数字0则说明该项不显著,如果置信区间不包括数字0则说明该项呈现出显著性。
具体数值还可通过SPSSAU输出的回归系数中间过程值表格查看,见下图:
从上表可以看出,3个自变量回归系数对应的置信区间均不包括0,说明3个自变量对因变量的影响均呈现出显著性。
综上所述,探究工资的影响关系,经过基本关系分析后,得到与因变量有相关关系的自变量后进行多元线性回归分析,发现初始工资、教育程度、工作经验对工资有显著影响,其中工作经验对工资的影响最大,多元线性回归分析结束。