正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又常常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。
正态分布的特性:
1)正态分布的95%命中区间是(μ-1.96σ,μ 1.96σ)
2)变量X服从平均值为μ,标准差为σ,可以利用公式将其变换为标准正态分布
Z=(X-μ)/ σ
3)变量X服从平均值为μ,标准差为σ的正态分布时,95%的预测命中区间为解不等式
-1.96≤(X-μ)/ σ≤ 1.96 所得的范围
5、假设检验
母群体服从正态分布时,可以通过假设总体参数,来检验观测值是否落在95%的命中区间内。通过以下公式可以计算基于假设的总体参数的观测值的范围
-1.96≤(X-μ)/ σ≤ 1.96
如果观测值在这个范围内,接受假设,假设成立;如果不在这个范围内,假设被舍弃。
6、区间估计
区间估计针对母群体的总体参数,在假定总体参数的情况下,只集合列现实观测到的数据在观测数据的“95%预测命中区间”的总体参数。根据区间估计缺点的总体参数的范围叫做“95%置信区间”
95%置信区间是这样一种区间:它由各种各样的观测值用相同的方法进行区间估计,其中95%包含正确的总体参数。
二、推论统计
正态分布母群体
正态分布母群体的总体均值为μ,总体标准差为σ时,n个观测数据x的样本均值x的分布仍为正态分布,且样本均值x的期望仍为μ,但标准差为σ/√n(标准误差)
- 已知总体方差,估计正态母群体的总体均值
正态母群体中已知总体标准差为σ时,可以从n个样本估计整体均值μ
保留满足:
-1.96≤(x -μ)/(σ/√n)≤1.96,求得μ的95%置信区间
2、已知总体均值,估计正态母群体的总体方差
1)由n个观测值计算V
2)从卡方分布临界表中求得自由度为n的卡方分布的95%预测命中区间
卡方分布临界值表的行索引为自由度,列索引为概率
值的含义可以理解为自由度为行索引时,大于该值的数据的概率为列索引
例如:对于自由度为5的卡方分布V来说,V的值有95%在“0.8312≤V≤12.8325”中。
3)解不等式求出σ²的95%置信区间。
3、未知总体均值,估计正态母群体的总体方差
步骤:
1)计算样本均值x,根据样本均值计算样本方差s²
s²=[(x1-x)² (x2-x)² …(xn-x)²]/n
2)计算统计量W