在上篇短文中《》,我们简要介绍了PyCaret的特点以及针对分类问题的建模示例。然而,在机器学习领域中,除了分类问题外,回归问题也是十分重要的。因此,本文将继续探讨PyCaret在回归问题上的应用示例。
什么是回归(Regression)回归(Regression)是统计学和机器学习领域中一种重要的分析方法,用于研究变量之间的关系。具体来说,回归分析旨在了解自变量(或称为预测变量、解释变量)与因变量(或称为响应变量)之间的关系,并利用这种关系来预测或解释因变量的值。
在回归分析中,我们通常假设自变量与因变量之间存在某种函数关系。这种函数关系可以是线性的,也可以是非线性的。回归分析的目标是通过拟合合适的模型来估计这种函数关系,并利用该模型进行预测、推断或解释。
回归分析广泛应用于各种领域,例如经济学、金融学、医学、工程学等。常见的回归分析包括简单线性回归、多元线性回归、逻辑回归、岭回归、Lasso回归等。
PyCaret回归(Regression)示例1.加载数据from pycaret.datasets import get_data
#dataset = get_data('diamond')
dataset=pd.read_csv('/home/diamonds.csv')
dataset
将数据集分成两部分:一部分用于建模(训练和验证),另一部分作为未见过的数据用于进行预测。
data = dataset.sample(frac=0.9, random_state=123)
data_unseen = dataset.drop(data.index)
data.reset_index(drop=True, inplace=True)
data_unseen.reset_index(drop=True, inplace=True)
print('Data for Modeling: ' str(data.shape))
print('Unseen Data For Predictions: ' str(data_unseen.shape))