- 外推(extrapolation):假设我们只能获取 2001 年到 2012 年的有限数据,并且我们想要预测 2013 年到 2018 年的大学毕业生人数。
可以看出,具有硕士学位的大学毕业生数量几乎与年份呈线性增长。 因此,将一条线拟合到数据集中是有意义的。 用这12个点拟合一条线,然后在未来6个点上测试这条线的预测,可以看出预测非常接近。
用数学语言定义回归分析,就是用指定的数据点在一定的损失函数约束下估计某个函数的参数:
2、回归分析的类型现在我们来谈谈进行回归的不同方法。 根据函数族 (f_beta) 和使用的损失函数 (l),我们可以将回归分为以下几类。
- 线性回归
- 多项式回归
- 岭回归
- Lasso回归
- ElasticNet回归
- 贝叶斯回归
- 逻辑回归
在线性回归中,目标是通过最小化每个数据点的均方误差之和来拟合超平面(二维数据点的线)。
从数学上来说,线性回归解决了以下问题: