现代主义以来,小说在形式和内容上都愈加繁杂多样、甚至晦涩难懂,这种复杂趋向是否有内在原因推动?我们能否进行有效度量?在 2016 年一个来自波兰的物理学家团队,通过采用统计短句和长句句长变化分布的方法,对一百多部世界名著进行了文本复杂度分析,发现绝大多数作品都存在长程相关性和分形结构,尤其是多重分形可以作为文学作品复杂度的度量指标,并指出这种结构的成因与生物和社会活动高度相关。
论文题目:
Quantifying origin and character of long-range correlations in narrative texts
论文地址:
https://www.sciencedirect.com/science/article/pii/S0020025515007513
小说是什么?为什么小说在现代世界里会越来越复杂?
对这个问题的回答,也许不仅关乎文学本身,更关乎我们当下的生活,和人类历史与未来的道路。
在经历过一战创伤后,20 世纪哲学家、现象学创始人胡塞尔,在去世前谈到欧洲人性危机时曾说[1],危机的根源其实不在现代,而在前现代世界的初期,在伽利略和笛卡尔那里。自从欧洲理性主义和科学兴起,就将世界缩减成了科学探索的一个简单对象,从而将具体的生活世界排除在外了。因此专业愈是分工,人们掌握的知识越深,就变得越盲目,既无法看清世界的整体,又无法看清自身。
在这个过程中,传统价值也逐渐趋于崩溃,人们不再有确定不移的信仰,世界被祛魅,基于简单规律的机械世界和工具理性,在人们眼中,渐渐取代了复杂而丰富的生活与人性本身。
图1:绝对时空观下的钟表宇宙
无可否认的是,世界的复杂是无法掩盖的。二十世纪两朵乌云[2]催生的相对论与量子力学,罗素悖论引发的第三次数学危机,以及非线性科学与混沌革命下诞生的复杂系统科学,让即使在科学内部也已经窥见到了确定性的丧失。这些源与于笛卡尔的理性遗产,一种简单、还原、确定价值的世界观,与复杂世界的矛盾开始在近代开始爆发,它包括人性加剧异化、国家与民族主义兴起,两次世界大战、现代性与后现代主义思潮。
在胡塞尔看来,这就是人的异化与现代性危机的由来[3]。
然而,人们真的遗忘了存在的本真、遗忘了生活世界的复杂与丰富吗?
捷克小说家米兰·昆德拉认为,实际并非如此。只是哲学家忽视了,在笛卡尔之外,还有另外一位现代的奠基人,他就是西班牙文学巨人塞万提斯。在火药胜过骑士精神的年代,《唐吉坷德》这部终结骑士传奇的最后一部骑士传奇,穿梭于虚构和现实之间,开创了真正意义上的现代小说:一种立足于整个人类延续性,探索世界复杂性和生活何以可能的叙事艺术:
从现代的初期开始,小说就一直忠诚地陪伴着人类。它也受到“认知激情”(被胡塞尔看作是欧洲精神之精髓)的驱使,去探索人的具体生活,保护这一具体生活逃过“对存在的遗忘”;让小说永恒地照亮“生活世界” ——《小说的艺术》
图2:捷克著名小说家米兰·昆德拉
小说告诉我们,世界是不能被简化的,不是实验室这台冰箱里的大象,是一个活生生的、充满各种可能性、复杂而丰富的整体。
——作为哲学家的胡塞尔,和作为小说家的昆德拉说得有道理吗?
这些我们心中的疑惑与不确信性,也许简单的科学已不足以做出结论。
作为一种基于文本书写叙事的艺术,小说在故事情节和内容不仅可以超出现实逻辑,长度也不受限制。之前我们曾经介绍过,对结构复杂度的衡量[4]是预测人们图像偏好的良好指标。美和复杂度之间具有一种相似关系。
那么对于文学艺术呢?在叙事文本中是否可以找到类似的复杂性的度量指标,可以用来评判一部叙事文本的优劣程度?
一个很自然的想法就是文本所蕴含的信息量。然而,文学的艺术不是记事——它要求叙事内容之间有高度的关联,仅仅是对各种信息的罗列并不构成小说,否则一部辞典的信息量会超过任何一部经典名著了。
在2016 年的《Information Sciences》杂志上,一个波兰物理学家团队研究了这个问题,并发表了一篇名为《量化叙事文本中长期关联的来源和特征》的论文,他们选取了世界范围内的一百多部文学作品进行了文本复杂度分析。
通过研究这些名著中句子长短和结构的变化,他们发现,绝大多数作品中都有一个十分有趣、同时又具备美学价值的最佳结构。这种结构不仅包含了一定程度上的自相似性,即作品每一个小部分在延展开之后和整体的结构协调一致,不同句子间的长度变化还呈现出一种级联性的长程动力学 (the dynamics of a cascade)关联。显然,前者是分形结构的典型特征,而后者则是复杂网络系统的一种属性[5]。
在此基础上,研究者们提取了两个指标作为评判一部作品叙事复杂度标准:长程相关性(long-range correlations)与多重分形复杂度(Multifractal)。
什么是多重分形?
多重分形系统是分形系统的推广,对后者单个指数的分形维数已不足以描述整个系统的动态。在直观上可将多重分形形象地看作是由大量维数不同的单一分形交错叠加而成的。多重分形系统在自然很常见,包括海岸线的长度、完全展开的湍流、太阳磁场的时间序列变化、心跳的动力过程、人类的步态和活动、人类的大脑活动等等。
对于多重分形,可以通过定义广义维度,或者采用一个连续的指数谱即奇异谱(Singularity spectrum,也被称为多重分形谱)函数进行描述[6]。
图3:自然形成的多重分形地貌
在人类原本的自然语言中,使用短句一直是有效的交流方式。但是,仅仅由此类句子组成的文本看起来很机械,读起来很无趣。相对的,由长句组成的文本则需要大量的理解力,这是以书写为主要载体的小说的特征。在文字媒介上,人们可以反复阅读一段文字以进行深入理解。因此,可以着眼于文本的句长变化开始对小说进行研究。
研究者们首先定义了句长变异性(sentence length variability,SLV)的统计变量,然后选取了选择了113种英语,法语,德语,意大利语,波兰语,俄语和西班牙语文学文本的语料库。
设一个连续的句子 j 包含一系列的单词,长度以所包含单词数l(j)表示。可以看到,句子是纯粹由语法定义的,是一个以大写字母开头并以句号结尾的单词序列。由此,可以由傅里叶变换的模平方(Fourier Transform modulus squared)得到代表短句和长句长度分布的谱密度(power spectra)分布函数 S(f) :