散点图中点的分布形状很多,对六西格玛质量管理人员来讲,最感兴趣的往往是这些点是否散布在某条直线附近,因为如果这一趋势出现,就可以通过一个变量的取值去预测或控制另一变量的取值。
这里的例子使用Minitab软件自带数据Pulse.mtw,分析的是变量Weight与Pulse 1的关系,以及反映两变量各自的分布情况的箱形图。由二维散点图可以看出,变量weight与pulse 1间不存在相关关系,即人体脉搏不会因体重的差异而有区别,这也符合现实中人体的生理特征。由变量weight的箱形图可见有一点为异常点(outliers),处于上限以外,说明有一人的体重较大,通过图表的编辑功能Brush选项,可查看关于该点的具体信息,对该个体应予重点关注。在变量pulse 1的箱线图中,无异常点出现,说明观察对象的脉搏均无不良现象发生。在六西格玛质量管理分析中,尤其是有关的统计分析,一定要结合实际情况,以防判断错误,例如从数据看,有些变量间存在相关性,并且相关性较强,但现实中两变量并不相干,这种相关也成为伪相关。
3、矩阵图
矩阵图也是散点图的一种,可在一张二维图中,显现多个变量间的分布关系图,这样可在一张图表中观察多个变量间的相关性,方便了多个数据间的数据分析,可以节省很多时间。一个矩阵图最多可以分析20个变量。
4、边际图
边际图实际上也是散点图的一种,通过在与Y轴和X轴平行的方向上附带关于变量Y和变量X的直方图、箱形图或点图的边际图,可以对两变量的分布情况进行个别分析。
产生一个边际图,在Graph菜单下的MarginalPlot对话框中选择即可。在对话框中,分别输入作为Y轴和X轴的变量Y和X,选择边际图的种类,可在直方图、箱形图或点图中择一,同时可选择要做边际图的变量,可以只做变量Y或变量X的边际图,也可给两变量都做边际图,另外还可选择Y轴和X轴的标记以及图表的标题,来取代默认值。
在Symbol选项中,可为数据点显示设定属性值,如显示的符号、颜色等。
Options对话框中,可用来设定坐标轴的刻度取值,标记属性值等。如取两个坐标轴的最大刻度值与最小刻度值相同时,在一定情形下,可使具有相同计量单位的两个变量更具可比性。
边际图包括二维的散点图和每个变量的分布图,其中二维的散点图可用来分析两变量间的相关性以及两变量间的联合分布,而每个变量的分布图可用来分析各个变量的分布情况。
Graph variables 选项用来指定要分析的变量,其中至少要选择两个变量,但最多不能超过20个。使用Minitab软件自带数据Pulse.mtw,在该选项中由左侧的变量列表选入Pulse1、Pulse2、Height、Weight,可分析这四个变量间两两的相关关系。
Options子对话框中的可选项有:列出矩阵全部(默认值)或左下角或右上角的内容;将变量名放在矩阵的对角线位置(默认值)或是在边界上;为分辨重叠的数据点,加入“Jitter”作数据点的offset,系统默认为不加任何显示信息。
矩阵图中每个散点图所反映相关关系的变量为该散点图横向和纵向分别对应的变量。如本例的矩阵图中右上角的散点图横向对应变量Pulse1,纵向对应变量Weight,所以该散点图反映了变量Pulse 1和Weight间的相关关系。
从该矩阵图可见,变量Pulse 1与变量Weight和Height间均不相关,变量Pulse2与变量Weight和Height间也均不相关,说明脉搏与体重和身高即人的体形均无关系,符合现实中的实际情况。在变量Weight和Height的散点图中,一变量值随另一变量值的增加而增加,两者呈现出明显的正相关关系,反映了实际情况,一般体重会随身高的增加而增加。
散点图、边际图、矩阵图都是用来描述两变量间的相关关系,当只是分析两个变量间的关系时,选用一般的散点图即可;当同时要描述各个变量的分布情况时,选用边际图;若要在一张图表中同时分析多个变量间的关系,选用矩阵图。各个图表关于相关关系的分析是一致的。
5、等高线图
等高线图是将三个变量描绘在二维图表中,若横坐标和纵坐标分别代表变量X和Y,则第三个变量Z可看作是绘图平面内/外的延伸,图中阴影部分代表变量Z的值。
Graph菜单下的Contour Plot是用来做等高线图的,在其主对话框中,分别输入变量X和Y、Z,其中的变量X和Y分别设为等高线图的横坐标和纵坐标,变量Z则作为第三变量。Data Display 选项可指定数据的显示形式:区域(Area)或连接线(Connect),同时可指定区域的填充颜色与大小以及连接线的种类、颜色与大小。
使用Minitab软件的自带数据Exh_grph.mtw,在Contour Plot主对话框中Z栏下选择输入Alt,Y栏下输入Lat,X栏下输入Long。选择Area方块,并且单击Attributes,进入对话框,Filltype中输入1(1=solid),Fill color中输入4 15 2 5 3,分别代表蓝色、灰色、红色、青色和绿色。
在等高线图中,阴影是XY平面上由等于z值的线条或线条所围成的区域所组成。对等高线图的分析,也主要从这个角度进行。
本例分析的是经度、纬度与海拔高度间的关系。
6、多变量图
六西格玛质量管理中,当研究多个指标时,可应用多变量图形象地描绘变量间的关系。多变量图是以图示的方法来呈现连续性数值方差分析的数据,这些图也可以用于在做方差分析之前,先对数据有一些初步的形象了解。这个图的实现不是在Graph菜单了,而是在Stat菜单下的Quality Tools下的Multi-Vari Chart。在其主对话框中,各选项和子对话框可实现的功能有:
Response:输入被解释变量所在的数据列名称,该变量必须为数值型;
Factor:输入因子变量,最多可输入四个,因子变量可为数值型、文字型或日期/时间型;
Options子对话框:绘图显示每个数据点、用直线将每一因子的样本均值连接起来、设定绘图输出标题取代默认值。
使用Minitab软件的自带数据Sinter.mtw。这一数据是用来评估三种金属在强压下熔渣时间的效应,数据收集过程是在每个熔渣时间:100、150和200分钟里分别测量每种金属的5个样品,在进行数据分析之前,首先想要以多变量图看看是否有明显的趋势或交互作用。
在输出的多变量图中,在每一金属类型上都有连接三个点的连线,这三个点表示在对应的金属类型下,各个时间段里金属的压缩强度平均值,也反映了各个金属类型组内的信息,图中横方向连线上的各个点分别代表三种金属的压缩强度平均值,代表着各个金属类型组间的信息。
结果显示,三种金属分别对应于熔渣时间的压缩强度差异较大,说明金属的种类与熔渣时间的长度有交互作用,与三类金属的最大压缩强度所对应的熔渣时间分别为:100分钟、150分钟、200分钟。
若要将因子间的交互作用和其他因子作用量化,可以进一步采用方差分析或一般的线性模式等方法。