一、案例介绍
某医师预研究糖尿病患者的总胆固醇和甘油三酯对空腹血糖的影响,某研究者调查40名糖尿病患者的总胆固醇、甘油三酯和空腹血糖的测量值如下,试根据上述研究问题作统计分析。
二、问题分析
本案例想要研究一些变量(总胆固醇和甘油三酯)对另一变量(空腹血糖)的影响,可以使用多元线性回归分析进行研究。多元线性回归分析比较重要的假设有以下5个:
假设1:线性——因变量与自变量之间存在线性关系
假设2:独立性——各观测值之间相互独立,即残差之间不存在自相关。
假设3:正态性——残差接近正态分布。
假设4:方差齐——残差的方差齐。
假设5:多重共线性——自变量间不存在多重共线性。
如果违反了这些假设中的一个或多个,那么可能导致线性回归分析结果不可靠。因此我们需要对假设1-5使用软件进行检验。
三、前提假设检验
(1)检验假设1:线性
多元线性回归分析要求因变量Y与自变量X之间存在线性关系。针对连续型自变量,可以通过绘制自变量与因变量的散点图,直观判断是否存在线性关系。而对于分类自变量(如学历),可以忽略与因变量之间的线性关系。
使用SPSSAU分别绘制Y空腹血糖和X1总胆固醇、X2甘油三酯的散点图,在【可视化】模块选择【散点图】,将数据拖拽到右侧相应分析框中,点击开始分析,操作如下图:
SPSSAU输出散点图如下:
①总胆固醇和空腹血糖散点图