极差是只考虑了最大值和最小值的发散程度指标;相对来说,方差包含更多的信息;标准差基于方差,但是与原始数据同量级;变异系数基于标准差,但是进行了无量纲处理。使用NumPy计算极差、方差、标准差和变异系数:
from numpy import mean, ptp, var, std
#极差
ptp(data)
#方差
var(data)
#标准差
std(data)
#变异系数
mean(data) / std(data)
4.偏差程度(z-分数)
之前提到均值容易受异常值影响,那么如何衡量偏差、偏差到多少算异常是两个必须要解决的问题。定义z-分数(Z-Score)为测量值距均值相差的标准差数目: