1. 定义
在统计学中,一个样本的置信区间是对总体参数的一个区间估计。置信区间给出的是,声称总体参数的真实值在测量值的区间所具有的可信程度或者说是概率。这个概率又叫做置信水平。举例来说:再一次大选中,上帝视角看到某人的支持率是55%,而置信水平0.95上的置信区间是(50%,60%),那么他的真实支持率落在50%到60%之间的概率为95%,如果分布是对称的,那么他支持率不足50%的概率只有2.5%。
对于一个给定的情况,置信水平越高,置信区间就会越大。置信区间表示具体的某个范围,置信水平是一个概率,表示真实值落在这个区间内的概率。
2. 参数估计置信区间属于参数估计中的区间估计
参数估计主要包括点估计和区间估计。其中点估计包括:一阶矩、二阶矩估计、极大似然估计、最小二乘法估计。而置信区间属于区间估计。
3. 置信区间我们通过对人类身高的估计来讲解什么是置信区间。
3.1 上帝视角对于人类的平均身高,没有办法全部统计,因为人太多。但是这个数据肯定是真实存在的,我们可以说,上帝知道。也就是说上帝视角可以看到人类身高的真是分布,假设满足正态分布:均值145,标准差1.4.
3.2 点估计愚蠢的人类想要统计平均身高,没有别的办法,只能进行抽样统计
比如在一次抽样过程中,我们把算出来的样本均值画在图上,蓝色点表示:
那么这个抽样的身高均值就是对真是平均身高的一次点估计。通过一次又一次的抽样,我们可以得到很多个不同的点估计: