如果我们把原假设变为掷硬币的结果不会偏重于正面朝上,即 P ≤ 0.5,在这种情形下,我们使用单边检验。如果 X 远大于 500,我们就拒绝原假设,如果 X 小于 500,就不拒绝原假设。因此,显著性为 5% 的检验需要使用 normal_probability_below 来找出小于 95% 的概率对应的截点:
这是更有效的检验。如果 X 小于 469,我们就不再拒绝 H0(如果 H1 为真,这不太可能发生),当 X 在 526 和 531 之间时则拒绝 H0(如果 H1 为真,这很有可能发生)。
p-值
进行上述检验的另一种方式涉及 p 值。我们不再基于某个概率截点选择临界值,而是计算概率——假设 H0 正确——我们可以找到一个至少与我们实际观测到的值一样极端的值。
对于硬币是否均匀的双边检验,我们可以做以下计算:
如果我们希望看到结果中有 530 次为正面朝上,可以这样计算:
注意
为 什 么 我 们 用 529.5 而 不 用 530 ? 这 就 是 所 谓 的 连 续 校 正(continuity correction)。它反映了一个事实,即对从掷硬币结果中看到 530 次正面朝上的概率而言,normal_probability_between(529.5, 530.5, mu_0,sigma_0) 是比normal_probability_between(530, 531, mu_0, sigma_0) 更好的估计。
相应地,normal_probability_above(529.5, mu_0, sigma_0) 是看到至少530次正面朝上概率的更好估计。你可以在通过代码生成的图 6-4 中看到。
验证这种观点是否合理的一个方法是模拟: