我们发现,年龄的VIF远大于10,故去除年龄这一变量,去除后重新计算剩余变量VIF发现所有均<10,即可继续。
4. 计算调整R方
5. 数据标准化
我们希望不同自变量的线性系数,相互之间有可比性,不受它们取值范围影响。
6. 拟合模型,计算回归系数
共享单车分数案例,因变量是分数,自变量是年龄、组别、城区,线性回归的结果为:分数 = 5.5 2.7 * 年龄 0.48 * 对照组 0.04 * 朝阳区 0.64 * 海淀区 0.19 * 西城区。
我们发现,年龄的VIF远大于10,故去除年龄这一变量,去除后重新计算剩余变量VIF发现所有均<10,即可继续。
我们希望不同自变量的线性系数,相互之间有可比性,不受它们取值范围影响。
共享单车分数案例,因变量是分数,自变量是年龄、组别、城区,线性回归的结果为:分数 = 5.5 2.7 * 年龄 0.48 * 对照组 0.04 * 朝阳区 0.64 * 海淀区 0.19 * 西城区。
Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.