模型公式显示在智能分析中,可直接使用。
本例中得到的分析结果为:
产品、促销、个性化服务、保护隐私四个变量对购买意愿有正向影响关系。
到这里很多人认为已经分析完了,可以得出结果,实际上还远远没结束。回归模型有很多限制条件,上述步骤里我们只是构建了模型,至于模型质量如何,模型是否满足线性回归的前提条件,都需要在这一步进行确认。
通常需要对线性回归模型检验以下几个方面:
多重共线性
在进行线性回归分析时,容易出现自变量之间彼此相关的现象,我们称这种现象为多重共线性。
当出现严重共线性问题时,会导致分析结果不稳定,甚至出现回归系数的符号与实际情况完全相反的情况,因而需要及时进行处理。
①诊断指标
检验多重共线性,可查看分析结果中的VIF值。
VIF>5说明存在共线性问题,VIF>10说明存在严重的多重共线性问题,模型构建较差,需要进行处理。
②处理方法
(1)增加分析的样本量,是解释共线性问题的一种办法,但在实际操作中较难实现。
(2)对自变量进行相关分析,找出相关系数高的变量,手工移出后再做线性回归分析。
(3)采用逐步回归法,让系统自动筛选出最优分析项,剔除引起多重共线性的变量。
(4)如果不想涉及核心自变量,不希望剔除,可使用岭回归分析。
残差独立性(自相关)
残差独立性是线性回归方程的基本前提之一。如果回归方程存在自相关,说明可能存在与因变量相关的因素没有引入回归方程,整体模型构建较差。
①诊断指标
D-W值用于判断自相关性,判断标准是2附近即可(1.8~2.2之间),如果达标说明没有自相关性,即样本之间并没有干扰关系。