频率分布直方图的运用:
频率分布直方图能清楚显示各组频数分布情况又易于显示各组之间频数的差别。它主要是为了将我们获取的数据直观、形象地表示出来,让我们能够更好了解数据的分布情况,因此其中组距、组数起关键作用。
分组过少,数据就非常集中;分组过多,数据就非常分散,这就掩盖了分布的特征。当数据在100以内时,一般分5~12组为宜。
从频率分布直方图可以估计出的几个数据:
1、众数:频率分布直方图中最高矩形的底边中点的横坐标 。
2、算术平均数:频率分布直方图每组数值的中间值乘以频率后相加。
3、加权平均数:加权平均数就是所有的频率乘以数值后的和相加。
4、中位数:把频率分布直方图分成两个面积相等部分的平行于Y轴的直线横坐标。
二、画直方图的步骤:
1、找出所有数据中的最大值和最小值,并算出它们的差。
2、决定组距和组数。
3、确定分点。
4、将数据以表格的形式列出来。
5、画频数分布直方图(横坐标为样本资料、纵坐标是样本频率除以组距)。
与频率分布直方图相关的一种图为折线图。我们可以在直方图的基础上来画,先取直方图各矩形上边的中点,然后在横轴上取两个频数为0的点,这两点分别与直方图左右两端的两个长方形的组中值相距一个组距,将这些点用线段依次联结起来,就得到了频数分布折线直方图。
三、直方图和条形图比较:
1、直方图横轴上的数据是连续的,是一个范围。条形图横轴上的数据是孤立的,是具体的数据。
2、直方图用长方形的面积表示频数,长方形的面积越大,表示这组数据的频数越大;只有当长方形的底宽都相等即组距相等时,才可以用长方形的高表示频数的大小。条形图用条形的高度表示频数的大小。
3、直方图中各长方形对应的是一个范围,由于每2个相邻范围之间不重叠、不遗漏,因此直方图中的长方形之间没有空隙;而条形图中各个数据之间是相对独立的,各个条形之间是有空隙的,并不需要相邻。
在样本中,有50%的个体小于或者等于中位数,同时也有50%的个体大于或者等于中位数,所以,在频率分布直方图中,在中位数的左边和右边直方图的面积是相等的。从而我们可以根据这个来估算出中位数的大小值。
每个矩形的面积就是这组数据的频率。把每个矩形的面积从左加起,加到接近0.5时(没超过)用0.5减去之前加得的面积,再用减得的数值除以下一组的面积,再乘以组距,再加上在与上一组之间的数就得到了中位数。
比如:有4组数据:[0,10),[10,20),[20,30),[30,40],频率分别为0.1、0.2、0.3、0.4,把前两组频率加起来,得0.3(再加第三组就超过0.5了),再0.5-0.3=0.2,再0.2/0.3约=0.67,再0.67*10=6.7最后20 6.7=26.7