除了死亡榜,还有生存榜。
对比狼家,狮家简直是AI真爱。继主角认定之后,AI又表示,小恶魔和詹姆都最不可能狗带。看来狼家在这场狮狼大战中是全面落败了呀。
看了这些分析,可能有人会质疑,AI可别是张口就来。那么AI到底是怎么得出这些结论的呢?
数据分析 网络理论,找出真主角
在谁是真主角的分析当中,Peter主要使用了三种方法来对《冰与火之歌》进行数据分析:
- 通过测量词汇多样性来评价词汇的丰富度
- 故事主线的人物足迹和词频分析
- 运用网络理论计算角色的重要性
文本处理是由Python来实现的。NLTK用于自然语言处理,Seaborn实现可视化,Networkx进行网络计算。
人物足迹和词频分析
《冰与火之歌》的章节是通过不同的视角(POV)呈现的,选择主要的POV角色名,就可以绘制出单词分散图,从而了解到这些名字都在小说中的哪个部分出现过。
而词频分析则为《冰与火之歌》正名,冰与火的主题词可不是【和谐】和【和谐】,这是一个围绕着“死亡”(1690次提及)、“血(缘)”(1629次提及)和“爱”(703次提及)的故事。
网络理论
对于《冰与火之歌》这样拥有两千多个出场人物的巨著来说,人物之间的相互关系推动着故事的发展。
Peter引入了网络理论来描述角色之间的关联性。