▲ 图2 2×2四格表检验统计量
▲ 图3 Fisher确切概率法结果
图1为2×2独立四格表资料的基本描述,每个格子中有3个数字,以第一个格子为例,“30”表示实际频数、“36.713”表示理论频数(计算公式为86×73÷171),“34.88”表示行所占百分比(计算公式为30÷86)。
图2为2×2独立四格表资料的各种统计量,包括卡方、似然比卡方检验、连续调整卡方、Mantel-Haenszel卡方、Phi系数、列联系数和Cramer V,我们主要关注第一个统计量卡方和第三个统计量连续调整卡方:
①当样本量n≥40,且每个格子的理论频数T≥5,采用第一个统计量卡方;
②当样本量n≥40,但有1≤T<5时,采用第三个统计量连续调整卡方;
③当样本量n<40,或有T<1时,用四格表资料的Fisher确切概率法。
图3为Fisher确切概率法的结果。当需要采用Fisher确切概率法时选择该表。
本题中,从第一个表中可以看出本例n>40,理论频数T>5,所以采用第一个统计量卡方,从表中可得P=0.0379,按α=0.05的水准,差异具有统计学意义,可以认为两种方法的有效率不同。
② 配对设计资料的χ2检验
例2: 某实验室分别用乳胶凝集法和免疫荧光法对58例可疑系统性红斑狼疮患者血清中抗核抗体进行测定结果见下表。问两种方法的检测结果有无差别?
表2 乳胶凝集和免疫荧光血清抗核抗体检测结果表
解析
两组或多组率之间比较常用的检验方法为卡方检验,本例为配对设计的计数资料,计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较,因此本例采用配对设计资料的卡方检验。
SAS结果如下:
▲ 图4 配对设计卡方检验结果
b c<40,所以应该用配对四格表校正公式。SAS输出结果表明:校正X2=5.78571,P=0.016157,差异具有统计学意义,可以认为两种方法的检测结果不同。
③ 四格表资料的Fisher确切概率法
例3:某医师为研究乙型肝炎(乙肝)免疫球蛋白预防胎儿宫内感染HBV的效果,将33例乙型肝炎表面抗原(HBsAg)阳性孕妇随机分为预防注射组和非预防组,结果见下表。问两组新生儿的HBV总体感染率有无差别?
表3 两组新生儿HBV感染率的比较