平均数和中位数都是社会经济指标体系中常用到的特征量数,其中平均数即总量除以个数的算术结果,反映出来的信息最充分,但容易受到极端数值的影响;中位数反映了数据组中间位次的数值情况,不易受到极端数值的影响,有较强的一般代表性,具有以下特性。
一、中位数能有效反映大多数的真实水平。用算术平均数反映人们收入状况时,如果人们的收入分配十分悬殊、地区差异分化严重,大多数中低收入人群的收入水平容易被少数超高收入群体的数值拉高,产生“被富裕”的虚假现象,代表性不强,说服力不够。而采用中位数则不受少数极端值的影响,能真实反映出大多数的一般水平。如2020年全国居民人均可支配收入中位数为27540元,平均数为32189元,中位数约为平均数的85.6%,反映出六成左右人群达不到平均水平。人均可支配收入中位数与平均数的比值大小在一定程度上可以反映出社会分配的公平程度,应加以关注。
二、中位数比较能直接反映大多数的变化程度和结构差异。平均数比较侧重反映的是整体规模的变化,而中位数比较集中反映的是结构均衡的差异。采用平均数对居民收入每年变化进行比较时,只看到收入总量相应于人口个数的变化,会掩盖掉一些公平、公正问题。平均数提高并不代表中位数也提高,在收入分化趋势严重时,中位数还会反向偏离平均数。同理,用平均数和中位数进行跨地区比较时,也会得出不同的结论,如广东省(2017年数据)人均可支配收入平均数为33004元,要高于江苏省(2016年数据)的32070元,而如用中位数进行比较则相反,江苏省为27436元,要高于广东省的26445元。
在许多情况下,平均数指标更能够反映地区经济发展的整体规模水平,但在民生类统计中,中位数则更具代表性,老百姓更有切身体验感。目前社会经济指标数据大都选取(或默认选取)平均数,如居民人均可支配收入、在岗职工平均工资、居民人均消费支出、恩格尔系数、人均居住面积、劳动人口平均受教育年限、人均基本公共卫生服务经费、个人卫生支出占卫生总费用比例、人均年出游次数、人均文化娱乐消费支出等指标数据,容易被少数极端数值的影响,产生“虚高”。因此,从衡量大多数人的中等水平、进而反映社会平等差距的角度来看,虽然平均数指标有其不可替代的作用,但也不应一味地使用平均数,在排除某些中位数统计较难的因素外,应尽可能地选取一些中位数作为评价依据和参考(如国家统计部门定期公布人均可支配收入中位数等数据),以便更全面、准确反映民生实际水平状况,也较易为广大群众所接受。