均方差或标准差为方差开根号。
平均绝对偏差和标准差这两个指标都是基于个体指标值与总体均值的偏差,作为个体指标散布程度的衡量,都是合理的,但是应用上,方差要重要得多。
下面来计算与比率相联系的总体方差:
设总体有N个个体,其中M个的指标值为1,其他的指标值为0(1和0是总体中的个体是否具有某种属性P的标志),则总体中一切个体指标值的和即为M,因而总体均值是
就是具有属性P的个体所占的比率。方差是:
4、了解了方差的意义后,我们利用它来讨论用样本均值估计总体均值的精度问题。
当用样本均值去估计总体均值时,样本大小n愈大,则估计得精度一般也愈好。这好像是大家都了解的事实。但它的道理何在,具体能精确多少,如何衡量呢?
其实前文介绍的方差可以理解为:从总体中抽出一个个体,以其指标值x去估计总体均值
由于x可以是a1,可以是a2,…也可以是aN, 各有1/N的可能性,故用x去估计`a,所产生的误差也有N种可能:或为a1 -`a或为a2 -`a…或为aN -`a,把这N个可能的误差平方相加,再用N除即得方差。
以上的分析方法对于抽取多个个体的情况也可以用。一般可以证明:
若有放回地抽样n次,并以它们的平均值`x估计总计均值,将有
也就是说,当用n个观测值的平均去估计总体均值时,方差只有期初方差的1/n。这个就称为样本均值`x的方差。
如果抽样是不放回地(样本大小n不能超过N),将有样本均值`x的方差为