Example of Linear Regression
线性回归的想法只是找到最适合数据的线。 线性回归的扩展包括多元线性回归(例如,找到最佳拟合的平面)和多项式回归(例如,找到最佳拟合的曲线)。 您可以在上一篇文章中了解有关线性回归的更多信息。
决策树Image taken from Kaggle
决策树是一种流行的模型,用于运筹学,战略计划和机器学习。 上方的每个正方形称为一个节点,节点越多,(通常)决策树越准确。 做出决策的决策树的最后节点称为树的叶子。 决策树直观且易于构建,但在准确性方面却不足。
随机森林随机森林是一种基于决策树的整体学习技术。 随机森林涉及使用原始数据的自举数据集创建多个决策树,并在决策树的每个步骤中随机选择变量的子集。 然后,模型选择每个决策树的所有预测的模式。 这有什么意义? 通过依靠"多数胜利"模型,它降低了单个树出错的风险。
例如,如果我们创建一个决策树,第三个决策树,它将预测0。但是,如果我们依靠所有4个决策树的模式,则预测值为1。这就是随机森林的力量。
StatQuest在完成这一工作方面做得非常出色。
神经网络Visual Representation of a Neural Network
神经网络是受人脑启发的多层模型。 像我们大脑中的神经元一样,上面的圆圈代表一个节点。 蓝色圆圈代表输入层,黑色圆圈代表隐藏层,绿色圆圈代表输出层。 隐藏层中的每个节点代表输入所经历的功能,最终导致绿色圆圈中的输出。
神经网络实际上非常复杂且非常数学,因此我不会对其进行详细介绍,但是…
Tony Yiu的文章对神经网络背后的过程进行了直观的解释。
如果您想更进一步并了解神经网络背后的数学原理,请在此处查看此免费在线书。
如果您是视觉/音频学习者,那么3Blue1Brown在提供了有关神经网络和深度学习的精彩系列。
分类在分类模型中,输出是离散的。 以下是一些最常见的分类模型类型。
逻辑回归Logistic回归与线性回归相似,但用于建模有限数量(通常为两个)结果的概率。 在对结果的概率建模时,使用逻辑回归而不是线性回归有很多原因。 本质上,以输出值只能在0到1之间的方式创建逻辑方程(请参见下文)。