从近期考到的一道题入手:
新教材中对回归方程的内容重新做了修订,相比于老教材,新教材对内容和概念的要求更高一些,在理解的要求上有些许的提高,今天把新教材中有关线性回归模型的内容做一次解释。
先说上题,决定系数又称判定系数,R²的作用是对回归直线方程拟合程度的分析,R²越大,拟合度越好,其中决定变量R²=r²,即决定变量等于样本的相关系数,本题中去掉B点后样本的相关性变强,R²也越大;对于C选项,去掉B点后样本被解释变量的残差变小,残差平方和也变小。
研究两个变量之间的相关关系主要从两个方向进行,一是进行相关分析,即量化变量之间相关的程度,学习时用样本的相关系数r来进行量化:
另外一个方向就是回归分析,以广告投入费用和销售额为例,随着广告投入费用的增加,销售额也呈上升趋势,销售额的观察结果y是由两部分叠加成的,一部分是由广告投入的线性函数引起的,记作a bx,另一部分是由随机因素引起的,记作e,所以y=a bx e
若两个变量呈现线性关系,则可用最小二乘法求解回归直线方程,书上有证明的过程,利用残差平方和最小求解a,b的值。