表4。在所有领域的层次结构中,每个义项的数量和百分比
图表3。语料库中每个词义的不同字数百分比
在我们的数据集中,绝大多数的词义(88%)在每一个类别层次上都只有一个、两个或三个词。主语料库中只有12%的义项具有四个或更多的词,在层级的任何一个CL中具有十个或更多同义词的不到2%。
这种词汇化的基本模式非常类似于农业和贸易(参见表格5):
表5。层次结构中每个义项的数量和百分比农业和贸易
两种情况下的结果几乎相同,大约80%的义项列出一至三个共下义词,大约20%的义项列出四个或更多。这表明,总的来说,这两个领域的词汇丰富度或同义率非常相似。与整个语料库一样,具有10个以上下位词的义项的比率非常低(大约1%农业2%用于贸易).
然而,当我们专门关注这些领域的自动下义词时,这种趋势发生了变化(见表6):
表6。层级中每个义项的数量和百分比:仅来自自动下位词(AHs)农业和贸易
我们可以看到,在层级结构中变窄或变宽的单词与高于平均水平的同形词共享语义空间。在…里农业只有52%的感官有一到三个单词,48%的感官有三个以上的单词。
在…里贸易模式非常相似,49%(一到三个单词)到51%(三个以上)。更高比例的单词属于具有10个或更多共下位词的类别(9%农业8%用于贸易)。