对统计学基本概念的梳理,其中普通字体为贾俊平著《统计学(第六版)》中的重要概念,引用字体的内容为书中没有但相关的概念。
第3章 数据的图表展示
原始数据 raw data
原始数据即为通过调查取得的未经处理的数据。
数据筛选 data filter
数据筛选是根据需要找出符合特定条件的某类数据。
频数 frequency
频数是落在某一特定类别或组中的数据个数。
频数分布 frequency distribution
把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布。
列联表 contingency table
由两个或两个以上变量交叉分类的频数分布表也称为列联表。
交叉表 cross table
二维的列联表(两个变量交叉分类)也称为交叉表。
比例 proportion
比例,也称构成比,它是一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或总体)的构成或结构。
百分比 percentage
比率 ratio
比率是样本(或总体)中不同类别数据之间的比值,由于比率不是部分与整体之间的对比关系,因而比值可能大于1。
条形图 bar chart
条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。条形图可以横置或纵置,有简单条形图、复试条形图等形式。
柱状图 column chart
纵置的条形图也称为柱状图。
帕累托图 Pareto chart
帕累托图是以意大利经济学家V.Pareto的名字命名的。该图是按个类别数据出现的频数多少排序后绘制的条形图。
饼图 pie chart
饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
环形图 doughnut chart
环形图与饼图类似,环形图中间有一个“空洞”,每个样本用一个环来表示,样本中的每一部分数据都用环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例,从而有利于对构成的比较研究。
累积频数 cumulative frequencies
累积频数是将各有序类别或组的频数逐级累加起来得到的频数,频数的累积方法有两种:一是从类别顺序的开始一方向类别顺序的最后一方累加频数,称为向上累积;二是从类别顺序的最后一方向类别顺序的开始一方累加频数,称为向下累积。
累积频率 / 累积百分比 cumulative percentages
累积频率或累积百分比是将有序类别或组的百分比逐级累加起来,它也有向上累积和向下累积两种方法。
分组数据 grouped data
将原始数据按照某种标准分成不同的组别,分组后的数据称为分组数据。在连续变量或变量值较多的情况下,通常采用组距分组。它是将全部变量值依次划分为若干个区间,并将一个区间的变量值作为一组。在组距分组中,一个组的最小值称为下限(lower limit),一个组的最大值称为上限(uppper limit)。
组距 class width
组距是一个组的上限与下限的差。
组中值 class midpoint
组中值是每个组中下限值与上限值的中间值,即:组中值=(下限值 上限值)/2
直方图 histogram
直方图是用于展示分组数据分布的一种图形,它使用矩形的宽度和高度(即面积)来表示频数分布的。在绘制该图时,在平面直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,这样,各组与相应的频数就形成了一个矩形,即直方图。
茎叶图 stem-and-leaf display
茎叶图是反映原始数据分布的图形。它由茎和叶两部分构成,其图形是由数字组成的。通过茎叶图,可以看出数据佮分布形状及数据的离散状况。
箱线图 box plot
箱线图是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。
散点图 scatter diagram
散点图是用二维坐标展示两个变量之间关系的一种图形。它是用坐标横轴代表变量x,纵轴代表变量y,每组数据(x,y)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图称为散点图。
气泡图 rubble chart
气泡图可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,另一个变量放在纵轴,第三个变量则用气泡的大小来表示。
雷达图 radar chart / 蜘蛛图 spider chart
雷达图是显示多个变量的常用图示方法。设有n组样本,每组样本测得P个变量,要绘制这P个变量的雷达图,具体做法是:先画一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,再将这P个点与圆心连线,得到P个辐射状半径,这P个半径分别为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示,再将同一样本的值在P个坐标上的点连线。