在统计领域,我们使用最多的指标,叫平均数,比如人均可支配收入、人均GDP、人均消费等,指一组数据中,处于平均位置的数值。
绝大部分情况下,平均值,与处在中间位置的数据,相差不会太大。
但如果一组数据中,最大值和最小值差异较大时,平均值会向上拉高,偏离中间位置。
为了解决统计中的这种现象,统计学家又发明了中位数,指将一组数据从小往大排列,处在中间位置的数值。
相对于平均数的“被平均”,中位数,更能反映人均数据的分布情况。
来自《2023年国民经济和社会发展统计公报》的数据显示,2023年全国居民人均可支配收入39218元,人均可支配收入中位数33036元。
平均数比中位数高6182元,按比例算,中位数仅为平均数的84%。
由于我国的宏观数据中,平均数居多,且大多时候没有中位数,无从得知更多场景下中位数占平均数的比例。
苏州市2023年8月底发布的《2022年苏州市企业部分职位薪酬调查信息(工资价位信息)》,是为数不多同时公布了平均数与中位数的公开数据。
这组数据,收录了苏州2022年6X8种职业的收入情况,包括10%、25%、50%、75%、90%分位数据和平均值。
我们仅对50%分位值(即中位数)和平均值做对比,用中位数/平均值X100,得到6X8种职业中位数占平均值的比例,并按照比例的分布情况,绘制成如下所示的饼图。
来自苏州6X8种职业抽样收入数据显示,中位数占平均值的比例,在66%到116%之间波动。
从分布看,59.4%的抽样职业,其中位数占平均数的比例,在95%到105%之间波动。即有时候中位数大于平均数,也有时候中位数小于平均数。
如果将范围扩大到正负10%,即中位数占平均数的比例,在90%到110%之间波动的话,苏州抽样的80%职业,中位数占平均数的比例,偏差在10%以下。
同时,这意味着,其余的20%职业,即大约120种职业,平均值会比中位数收入高出10%。