体操、跳水等体育比赛和戏剧、歌曲等文艺评比中,当一个选手动作完成或表演完毕后,先由受聘评委逐个亮分。然后采用“去掉一个最高分,去掉一个最低分”,再计算每个选手的平均得分。这种做法已为国内外很多赛事广泛采用。基于各自的观赏点,遇此情景观众中不免有唏嘘声。有的为砍掉最高分惋惜,有的为砍掉最低分庆幸。那么要问,这种评分方法依据何在?是否科学?
我们来分析一下。假定一次比赛有9个评委,9个评委给每个参赛选手所打分数,表现为一组数据。现在,我们就用9个评委给每个参赛选手所打分数的平均值作为这组数据的代表,来评价选手的成绩。这样做有时会出现什么问题呢?
如果9个评委给甲选手的打分是:89,78,79,77,76,75,81,79,74
计算得平均分为:78.67;
给乙选手的打分是:90,80,81,79,78,76,84,82,50
计算得平均分为77.78。
从平均分数上看,甲选手得分高于乙选手。
进一步分析这两个选手的得分会发现,除评委9为甲打的分数高于乙以外,其余评委为甲打的分数都比乙低,显然这样的比赛结果难以令人信服。什么会出现这种情况呢?因为平均值的大小与一组数据里的每个数据都有关系,其中任何数据的变动都会引起平均值的变动。如果数据中出现一两个极端数据,那么平均值对于这组数据所起的代表作用就会削弱。这里评委9给选手乙的打分远远低于其他评委,影响了平均值的代表性。评委9给选手乙所打的50分,远离其他人的打分,我们称这个数据值为异常值或离群值。
为了防止评委因为个人偏见而给出过高或者过低分数,人们想出了上述“去掉一个最高分,去掉一个最低分”的评分方法。这样可以避免异常值造成的影响。这种将少数异常值去掉后计算的均值也叫截尾均值。如果去掉最高分和最低分,我们来算一算,甲、乙两位选手的平均得分分别是多少?容易计算得:甲选手的平均分是77.86,乙选手的平均分是80。这样比赛结果就是乙选手成绩优于甲选手。显然这个结果比较公正。
截尾均值由于去掉了数据中影响数据稳定性的异常值,从而具有较好的稳健性。如果没有出现反常情况,去掉最高、最低分对平均分的影响是不大的。综合上述分析,我们知道:赛事组织者不讲情面的做法,是为了减少异常值对评分的影响,从而获得较为公正地反映选手水平的平均指标。