那现在我们没有办法得到真实的均值。那么只能用抽样样本的均值进行替换了。但是替换之后也出现了一个问题,样本均值和真实值之间存在一定偏差,所以即时区间长度相同,得到的区间也不同。假设我们抽样得到了100个区间,如下图:
可以看到,有的区间包含了真实值,有的区间没有包含真实值。那么100个区间,有多少个包含了真实值那?答案是95%。换个问法:从这100个区间中随机取一个区间,那么包含真实值的概率是多少那?答案是95%。
常见正态分布的图还是可以记一哈:
3.5 如何评价区间估计的好坏常用的标准有两类:(1)置信度标准 (2)精确度标准
置信度是一个概率,表示估计的区间包含真实值的概率。显然,置信度越大越好。
置信系数是置信度在参数空间上的下边界。因为对于不同的参数,估计出来的置信度不同,显然,我们希望最小的置信度也尽可能的大。所以置信系数越大越好。
精确度标准很多,最常用的是随机区间的平均长度,显然平均长度越小越好。