假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计方法。
假设检验的目的在于判断原假设的总体和现在实际的总体是否发生了显著差异。
假设检验过去称为显著性检验。它是利用小概率反证法思维,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。即在假设H0成立的条件下,计算检验统计量,然后根据获得的P值来判断H1是否成立。
P值小于或等于预先规定的概率值α时,则为小概率事件。
二、假设检验的基本步骤用例3-5举例说明
本例的目的是判断是否μ≠μ0。双侧检验;本例为连续性单样本资料,应用单样本t检验。
1、检验检验假设,确定检验水准
H0:μ=μ0,即从事铅作业男性工人的血红蛋白含量均数等于正常成年男性的均数。
H1:μ≠μ0,即从事铅作业男性工人的血红蛋白含量均数不等于正常成年男性的均数。
H0为检验假设,常称零假设/无效假设;H1为对立假设,常称备择假设。
需要注意的点:
①检验假设针对的是总体,而不是样本。
②后续统计量都是在H0成立的条件下计算出来的。
③H1的内容直接反应了期望出现的情况,在两个总体的比较中,也反映了检验的单双侧。若H1为μ>μ0或μ<μ0,则检验为单侧检验,它不仅考虑是否有差异,而且好考虑差异的方向;H1为μ≠μ0,则此检验为双侧检验。(单双侧检验的确定,首先要根据专业知识,其次是根据所要解决的问题来确定);探索性研究多用双侧检验,而证实性研究多用单侧性检验。以表3-4和3-5说明单双侧检验的确定。
α=0.05。
检验水准,也称显著性水准。α是预先规定的概率值,它属于Ⅰ型错误的范畴。在实际工作中常取α=0.05。α的数值可根据不同的研究目的给与不同的设置。
2、计算检验统计量
将数据导入SPSS中,点击“分析”---“单样本t检验”
将变量“铅作业工Hb含量”放入"检验变量"框中;在“检验量”框中输入已知的总体均数(μ0=140g/L),然后点击“确定”。
t=-2.137,P=0.04
应该根据统计推断的目的、设计方案、变量或资料类型、方法的适用条件等选择检验统计量。
如成组设计两样均数比较则根据资料特点选择t/t'/u等,而成组设计两样本方差比较选择检验统计量F。
有的检验方法无须计算出检验统计量,可直接计算出相应P值,如Fisher确切概率法。
3、确定P值,作出推断结论
上图为单样本t检验结果,结果显示统计量t=-2.137,P=0.04,小于0.05,故拒绝H0,接受H1,差异有统计学意义(统计结论);结合本题认为从事铅作业男性工人的血红蛋白含量均数低于正常成年男性的均数(专业结论)。
注意事项:
推断结论应包括统计结论和专业结论两部分;统计结论只说明差异有无统计学意义,而不能说明专业上的差异大小。
下结论时,对H0只能说拒接H0/不拒绝H0,对H1只能说接受H1,除此之外其他说法均不妥当。不拒绝H0≠接受H0。(2种结论:拒绝H0,接受H1;不拒绝H0。)
三、假设检验的注意事项1、Ⅰ型错误和Ⅱ型错误
Ⅰ型错误:客观实际——H0成立,假设检验结果——拒绝H0,为“弃真”的错误;
Ⅰ型错误概率用α表示,α可取单侧亦可取双侧。
eg:规定α=0.05,当H0实际成立而拒绝H0时,则理论上每100次检验中有5次发生这样的错误。
Ⅱ型错误:客观实际——H0不成立即H1成立,假设检验结果——“接受”H0,为“取伪”错误;
Ⅱ型错误概率用β表示,β只取单侧。
如果要同时减小Ⅰ型错误α和Ⅱ型错误β,唯一的方法就是增加样本含量n。
若重点减小Ⅰ型错误α,一般取α=0.05;
若重点减小Ⅱ型错误β,一般取α=0.10或α=0.20甚至更高。
注意:拒绝H0,只可能犯Ⅰ型错误;“接受”H0只可能犯Ⅱ型错误。
2、假设检验应该注意的问题
(1)要有严密的研究设计。保证均衡性最好的方法就是施加干预前的随机分组。
(2)不同类型资料应选用不同检验方法:应根据分析目的、资料类型分类和分布、设计方案种类、样本含量大小及不同统计学方法的使用条件等。
(3)正确理解“显著性”的含义:差异有“显著性”(有统计学意义),实际的临床意义要根据专业知识进行判断,两者不可混淆。当统计学结论无意义,专业结论有意义时,则应当检查设计是否合理、样本含量是否足够。
(4)结论不能绝对化:应列出检验统计量的值,报告具体P值或P的确切范围,写成“P=0.040”或者“0.020<P<0.050” , 而不能简单写成“P<0.050”。
(5)置信区间与假设检验的区别和*置信区间用于说明量的大小即推断总体参数的范围;假设检验用于推断质的不同即判断两总体参数是否不等。置信区间亦可回答假设检验的问题,算得的置信区间若包括了H0,则按照检验水准α,不拒绝H0;若不包含H0,则拒绝H0,介绍H1。另外置信区间还提供比假设检验更多的信息,即提示差别有无实际的专业意义。