卡方检验是很常用的一种分析方法,什么情况下使用卡方检验?
如果你手上的数据是一种定类数据,比如性别(男、女)是否患病(是、否)。你还想要分析定类数据和定类数据之间的差异关系。
例如想要分析性别和是否抽烟之间的关系。这一句话里面包含两个词语,分别是:性别,是否抽烟。性别为X,是否抽烟为Y。性别为定类数据,是否抽烟也是定类数据,此时就可以使用卡方检验。
这篇文章分享分别使用两种常见统计分析工具SPSS和SPSSAU完成卡方检验。SPSS是目前常用的统计软件,SPSSAU是更简单的在线数据科学分析工具。
一、案例数据
想研究性别和是否抽烟之间有没有关系,男性抽烟的比例有没有更高等,通过抽样调查得到如下数据:
二、卡方检验怎么做?
1、SPSS操作步骤
(1)传入数据或输入数据
打开SPSS软件,上传如下图所示的数据格式文件,或者在SPSS软件中手动输入下图所示数据:
第一列存入行(性别)信息,其中1代表男,2代表女;
第二列存入列(是否吸烟)信息,其中1代表吸烟,2代表不吸烟;
第三列存入每一种情况所对应的数据(人数),如:是男性且吸烟的人数有51人。
(2)数据加权处理
因为输入的数据是汇总格式,所以在进行卡方检验之前,我们需要先对数据加权处理,加权处理后,系统会将“人数”这一列的变量识别为频数,而不是一个数值。
数据加权的步骤如下:
在主页面点击【数据】-【加权个案】