四分位距又被称作四分差,可以提供数据分布中间的分布。
对于从低到高排序的任何分布,四分位距包含数据中一半的值。 第一个四分位数 (Q1) 包含前 25% 的值,而第四个四分位数 (Q4) 包含最后 25% 的值。
它衡量数据如何围绕均值分布。 基本公式为:IQR = Q3 - Q1
就像极差一样,四分位距在其计算中仅使用 2 个值。 但是IQR受异常值的影响较小:这2个值来自数据集的中间一半,所以不太可能是极端分数。
小知识:每个分布都可以使用五个数字摘要进行组织:
- 最低值
- Q1:第 25 个百分位
- Q2:中位数
- Q3:第 75 个百分位
- 最高值 (Q4)
方差表示数据集的分布范围,但它是一个抽象数字。它反映了数据集中的分散程度。 数据越分散,方差与均值的关系就越大。