以这个句子为例,Eddard(奈德·史塔克)和Jon(琼恩·雪诺)之间隔着4个单词,因此在故事里他们是“相近”的。
两个名字越相近且越频繁地出现在一起,就可以假设在故事中他们彼此交织,构成一组名称对。
使用一个包含25个单词的窗口并计算此窗口中所有名称对共同出现的次数,就能得到这组名称对的“权重”。
引入网络理论,判断一个角色与其他角色的关联性主要用到了四个关键概念:
- 度中心性——与该节点直接连接的节点占节点总数的比例
- 接近中心性——对于一个结点而言,它距离其它结点越近,那么它的中心度越高
- 中介中心性——量化该节点充当其他两个节点之间最短路径的桥梁的次数
- 特征向量中心性——一个节点的重要性既取决于其邻居节点的数量,也取决于其邻居节点的重要性
鉴于作者倾向于以稳定的速度*死关键人物,Peter认为中介中心性更有参考价值,它能衡量*死一个人物的难度。
可以看到网络理论认为龙妈处在边缘位置,重要性不仅不如囧雪和小恶魔,甚至连二丫也没比过。
机器学习实力预测死亡率
慕尼黑工业大学(TUM)的团队则是双管齐下,用两种方法来预测角色的死亡概率。
一个方法是从冰与火之歌和权力的游戏的维基百科中提取角色特征数据集,使用pymc3封装的MCMC方法来训练BAYESEAN生存分析模型。
另一个方法是在Python的Keras框架下训练神经网络。比起BAYESEAN生存分析模型,神经网络能够囊括更多“意外”死亡。
具体的训练方法他们写在了这个项目的官网中,而权游里每一个角色的死亡百分比也都可以在官网中查询到。想知道自己关注的角色会不会活到最后,熬夜追剧的同时,不妨也看一看机器学习的结论吧~
传送门
TUM: https://got.show/
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态