3.第一类错误和第二类错误
上文介绍了假设检验的过程,但是假设检验过程会不会出现错误呢?其实大家仔细分析拒绝原假设的理由就会发现问题了。通常情况下原假设是小概率事件,但是小概率事件≠0概率事件。小概率事件不是不发生,而是发生概率较小。就像天气预报说明天有99%的可能不下雨,结果1%的可能性成为了事实,明天下雨了。因此假设检验中会有两类错误(弃真错误和取伪错误)经常出现。
(1)第一类错误(弃真错误):
- 原假设为真时拒绝原假设。
- 第一类错误的概率为α(没错,就是它,我们的好朋友,小α。咳咳咳,就是显著性水平,一般由研究者事先指定,常用的值有0.01, 0.05, 0.10)。
(2)第二类错误(取伪错误):
- 原假设为假时未拒绝原假设。
- 第二类错误的概率记为β。
α和β的关系——α和β的关系就像翘翘板, α小β就大,α大β就小。所以两类错误不可能同时发生(第一类只在H 0 H_0H0为真时发生,第二类只在H 0 H_0H0为假时发生)。
影响β的因素:
- 总体参数的真值。
- 显著性水平α(当α减少时增大)。
- 总体标准差σ(当σ增大时增大)。
- 样本容量n(当n减少时增大)。
4.统计量与拒绝域
讲了这么多,但是还没有介绍假设检验的计算过程。假设检验的过程依赖于两个重要数学概念(统计量与拒绝域,前面已经有稍微提到了)。这里再做具体介绍。
检验统计量(test statistic)——根据样本观测结果计算得到的, 并据以对原假设和备择假设作出决策的某个样本统计量,是对样本估计量的标准化结果(原假设H 0 H_0H0为真,点估计量的抽样分布)。
标准化的检验统计量公式为:
标 准 化 的 检 验 统 计 量 = 点 估 计 量 − 假 设 值 点 估 计 量 的 抽 样 标 准 差 标准化的检验统计量=\frac{点估计量-假设值}{点估计量的抽样标准差}标准化的检验统计量=点估计量的抽样标准差点估计量−假设值
显著性水平和拒绝域的三种情况:
双侧检验: