在树状图底部有一条距离参照尺,它被分为20份(根据之前最小得分可能为0,最大得分可能为20)结合点是根据矩阵图得出的数据生成的。
比如:
桃子和桔子的距离是2,对应刻度尺上2的位置;樱桃和葡萄的距离为3,对应刻度尺上3的位置;而苹果和桔子、桃子的节点在4.5左右。
这是因为:苹果与桔子的距离为5,苹果与桃子的距离为4,苹果与他们两者的平均距离为(4 5)/2=4.5
这种连结方式为群平均连结法(Group Average)
聚类分析中可以采用不同的算法以确定连结生成的方式,很多支持层级聚类分析的商业软件都会让你选择使用哪种方法进行分析。群平均连结法是比较常用的一种。
层级聚类分析在卡片分类分析中之所以如此受用,是因为从层级距离的结果中可以直观的看到自己应该如何分组架构这些卡片(信息架构)。
一种方式就是对树状图进行垂直“切分”,之后就可以直观看到一共创建了多少个组。
如下图,如果在距离值为10的地方,设置垂直线,这条垂直线与四条水平线交叉在一起,也就形成了四个组。分别是:
(组1)香蕉
(组2)西红柿
(组3)李子、樱桃、葡萄、草莓
(组4)梨、桃子、桔子、苹果
但如果我把垂直线放置在距离尺7的位置,就与水平线切分出了6条,也就分为了6个组。
如果把垂直线放置在距离尺13的位置,就与3条水平线切分,也就分成了3个组。
所以是在多大的感知距离分组,没有一定之规,根据卡片多少和你觉得大概分为几组合适决定的。也可以设置多个垂直线,生成几种不同的分组方式,之后在用封闭式卡片分类分析哪种更适合。
二、封闭式卡片分类在封闭式卡片中,研究人员不光要给用户提供卡片,还要提供这些卡片进行分组的组名。
一般做完开放式卡片分类后,可以紧跟着做一个或多个封闭式分类,这样可以验证之前开放式卡片分类得出的结果。
比如通过开放式分类,研究者对54项元素做了开放式分类,从中获得了六种不同的架构这些元素的方式,每中架构方式的分组数从三个到九个不等。之后,通过六个平行的封闭式卡片分类研究来检测这六种架构方式哪种更科学。
下图研究的是这六种架构方式中的一种,在这种架构中一共分三组。现在让用户对这一分组进行封闭式卡片分类,把其中的10张分别放到三组中的某一组中。
最后一栏是最大比例,也就是占比最多一组的比率。方便直观的看到结果。
想看到的情况,应该像卡片10一样,有92%的参与者把它分到了C组,这是一个非常有把握的分类结果;而像卡片4就比较不确定,有48%的参与者把它放在A组,而37%的用户把它放在C组,用户在给这张卡片分组时,出现了严重的“分歧”。
而最后的平均数72.9%是最大比率的平均数,它被用来衡量某种架构分组方式是否行之有效。
比如这中分组方式的平均值是72.9%,另一种分组方式的平均值是53%,那就说明这种分组方式更行之有效。
但前提是它们需要包含相同数目的组,但如果一种分组方式有3组,另一个有8个组,就不能简单的用平均数比较了。
对于封闭式卡片,也可以用层级聚类法进行分析,分析的方法和开放式卡片分类一样。这样一来,就能直观地了解在封闭式卡片分类中呈现给用户的信息是否行之有效了。
本文由 @cating 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议