操作工具容易,解读结果难,今天跟大家总结一下Excel回归分析的结果应该怎么看,有误之处也欢迎各位小伙伴指正。
补充一句,Excel只能做线性回归,本篇的讨论也是在这个条件的基础上进行的,好了,闲话不多说,直接上结果吧。
表1:
Multiple R:相关系数R,值在-1与1之间,越接近-1,代表越高的负相关,反之,代表越高的正相关关系。
R Square:测定系数,也叫拟合优度。是相关系数R的平方,同时也等于表2中回归分析SS/(回归分析SS 残差SS),这个值在0~1之间,越大,代表回归模型与实际数据的拟合程度越高。
Adjusted R Square:校正的测定系数,对两个具有不同个数的自变量的回归方程进行比较时,还必须考虑方程所包含的自变量个数的影响,为此提出,所谓“最优”回归方程是指校正的决定系数最大者。(该释义来自百度百科)由于小编没有碰到过这种情况,所以还不知道该值的实际作用。
标准误差:等于表2中残差SS / 残差df 的平方根。这个与测定系数一样都能描述回归模型与实际数据的拟合程度,它代表的是实际值与回归线的距离,当然这个值越小越好,不过具体小到什么程度?由于这个值实在没有范围,因此还很难界定。
观测值:有多少组自变量的意思。
表2:
回归分析df:回归分析模型的自由度,以样本来估计总体时,样本中独立或能自由变化的个数。见上表,数据自由度等于样本组数减1,回归分析模型的自由度是1,即这个回归模型有1个参数,残差自由度等于总自由度减去回归分析模型的自由度。
回归分析SS:回归平方和SSR,等于回归预测Y值(表4)与实际Y均值的平方和。表4 残差等于实际Y值减预测Y值,残差SSE,即表4残差平方和。
MS:均方差,等于SS/df。
F:回归分析MS/残差MS。
Significance F:是在显著性水平下的Fα临界值,即F检验的P值,代表弃真概率,这个值一般要小于0.05的,且越小越好,1-本值即为置信度,本例回归模型的置信度未达95%。
表3:
Intercept Coefficients:截距的回归值,X Variable 1 Coefficients:斜率的回归值。本例即Y=-0.002641967X 82.26263918。
标准误差不必多说,越小参数精度越高。
t Stat:回归系数/标准误差,对于一元线性回归,F值与t值都与相关系数R代表差不多的意思,但是,对于多元线性回归,t检验是有必要的。