平均值等于每个小长方形面积(即概率)乘每组横坐标的中点,然后加和。
平均数,首先得直方图应该归一化,也就是说所有矩形的面积之和为1,然后每个矩形的面积代表其底边中点横坐标的数的频率,那么面积乘以横坐标就相当于频率乘以横坐标,得到的当然是平均数。
频率直方图中是没有样本数据的.在某一个分组里,分布在这个分组的样本数据没法找得出来,然后也分布不均匀,所以就用这个组的中点的横坐标来表示这个分组的样本数据的平均值。
而每一个小长方形的面积是表示相应的频率,(相当于相应数据的百分比)所以平均数等于每个小长方形的面积乘以相应的分组的底边中点横坐标的之和。
频率分布直方图的运用
频率分布直方图能清楚显示各组频数分布情况又易于显示各组之间频数的差别。它主要是为了将我们获取的数据直观、形象地表示出来,让我们能够更好了解数据的分布情况,因此其中组距、组数起关键作用。
分组过少,数据就非常集中;分组过多,数据就非常分散,这就掩盖了分布的特征。当数据在100以内时,一般分5~12组为宜。
从频率分布直方图可以估计出的几个数据:
众数:频率分布直方图中最高矩形的底边中点的横坐标 。
算术平均数:频率分布直方图每组数值的中间值乘以频率后相加。
加权平均数:加权平均数就是所有的频率乘以数值后的和相加。
中位数:把频率分布直方图分成两个面积相等部分的平行于Y轴的直线横坐标。
例题分享