- 几何平均数
- 中位数
将数据按照从小到大排列:
- 对于偶数个观测值,中位数为中间两数的平均值。
- 对于奇数个观测值,中位数为中间数。
- 众数
出现最多的数据,可能不止一个。
- 百分位数
至少有p%的数据小于等于该值,至少有1-p%的数据大于等于该值。
将数据按照从小到大的顺序排列,并计算n*p%:
- 若为整数,则取该值与下一位数的平均数。
- 若不为整数,则向上取整。
- 中位数、四分位数等是特殊的百分位数。
02
变异程度的度量
1.极差与四分位数间距
- 极差:最大值与最小值之差
- 四分位数间距(Interquantile Range,IQR):四分位数之差
极差与四分位数间距都是变异程度的简单度量,相比较而言,极差更容易受异常值影响,因此多采用四分位数间距。
2.方差与标准差
方差是对数据总体变异程度的度量。
- 总体方差: