从比兴到 Word Embedding

翻开任何一本讲中国古典文学的教材,你都会遇到”比兴”这个词。然后你会发现:几乎没有哪本书真正把它讲清楚。

朱熹说:”比者,以彼物比此物也;兴者,先言他物以引起所咏之词也。”这是最常被引用的定义。听起来好像说了什么,但你真的理解”引起”是什么意思吗?引起什么?怎么引起?为什么有的”先言他物”让人拍案叫绝,有的却显得生硬无关?不仅仅是教材里止步于此,讨论比兴到底是什么的论文,其实也有不少,可见其含混程度。

这种含糊不是偶然的。一方面,中国传统的文论本来就崇尚”不可说”、”只可意会”——玄妙被当作深度的标志,讲得太清楚反而被认为肤浅。另一方面我怀疑,相当一部分作者其实并没有真正想清楚自己在说什么,只是在重复前人的话,把定义传给下一代,谁也没停下来追问一句:”等等,这到底是什么意思?”

当然了,从来都不乏能够熟练使用比兴手法的作者,他们对什么是比兴肯定是非常清楚的,但他们的技巧很可能来自于反复的模仿和锤炼,而不是理论提炼,自己也很难说清楚。于是”比兴”就成了一个在教科书里被反复讲解、却始终模糊的概念。

本文想做的事情很简单:借助一点现代计算语言学的视角,把这个古老的技巧讲清楚。

2. 第一印象

历来讲比兴,都从《诗经》讲起,但我认为可以不必。比兴是中文的核心特征之一,在诗歌曲赋中使用很广泛,用当代的例子更直观,更容易理解。看这两句歌词:

六月里黄河冰不化,扭着我成亲是我大。

这是电影《黄土地》的插曲《女儿歌》的歌词。

第一次读,你可能觉得第一句很奇怪。六月的黄河结不结冰,和”我爹强迫我成亲”有什么关系?逻辑上句意上接不上。

再看一句:

浮水上的鸭子刮水上的鹅,
公家人不知我会唱歌。

鸭子和鹅跟”公家人不知我会唱歌”又有什么关系?

如果硬要给第一句找一个功能,最直接的答案是:押韵。”化”和”大”押韵,”鹅”和”歌”押韵。第一句像是一个音韵上的铺垫,为第二句的落点做准备。

这是很多人对”比兴”的第一印象——第一句没什么实际意义,只是个形式上的引子。但如果真的只是押韵,那换一句押韵的话应该效果一样好才对。可你试试就知道,不是这样的。

3. 第二层:第一句在提供情感支持

再读一遍”六月里黄河冰不化”。六月,盛夏,黄河本应奔流——却冰封不化。这是一幅违反常理、令人意外的画面。

然后第二句来了:”扭着我成亲是我大。”父亲强迫女儿成亲,这本身已经够沉重。但当它紧跟在”六月黄河冰不化”之后,那种震惊、错位的感觉,就从第一句渗透到了第二句里。

第一句不是没用的。它在读者脑子里先建立了一种情绪基调——震惊、不合理、不该如此——然后第二句借用了这个基调。

接下来一句:

五谷里数不过豌豆圆,人里头数不过女儿可怜。

豌豆在五谷里最圆——这是一个关于”极致”的陈述。然后:女儿在所有人里最可怜——又是一个关于”极致”的陈述。第一句不提供信息,它提供的是一种尺度校准:我要说的”可怜”不是一般的可怜,是像豌豆之圆那样无可比拟的可怜。

到这里我们可以更新理解了:第一句不是废话,它是一个情感上的铺垫,为第二句提供支撑——可能是情绪基调,可能是程度校准,可能是氛围。

4. 第三层:要避开有害的读法

既然第一句在为第二句提供情感支持,那是不是随便找一句能押韵、能唤起类似情绪的话就行?理论上是这样,但还有一层约束,不是随便什么替换都可以。

假设我们把”六月里黄河冰不化”换成”青竹苗压弯了树杈”。押韵还行,也是一幅不寻常的画面。但问题来了:青竹弯了,把树杈压断——这暗示的是”柔弱者压倒强硬者”。可第二句说的是什么?是父亲强迫女儿,是强硬者压迫柔弱者。方向正好相反。

这个第一句不但没支持第二句,反而在语义上干扰了第二句。读者脑子里会产生一种微妙的违和感,情感无法顺畅传递。

所以”比兴”的第一句不是随便选的。它不仅要能唤起和第二句方向一致的情绪,还要不能激活任何与第二句方向相反、或会削弱其情感的联想。一个好的比兴,是在语义空间里精心挑选过的。

5. 第四层:多角度的支撑

更进一步。”六月里黄河冰不化”其实不止一个读法。

一个读法是:反常、震惊。这支撑了”父亲强迫女儿”的那种不合理感。

另一个读法是:冰封不化——在中国文化语境里,”冰”常常关联着创伤、冻结的情感、无法化解的伤痛。这又支撑了第二句里那种无法抗拒、无处倾诉的压抑。

还可以有第三个读法:黄河,母亲河,象征命运、传统、家族。六月的黄河本该奔腾,却被冻住——个人的生命力被更宏大的力量冻结。这又支撑了一个旧式家庭里女性个体被压抑的主题。

这三个读法彼此不冲突,而是从不同角度共同指向第二句所要表达的情感场域。一个好的比兴,往往是这样的——第一句是一个多义的图像,它在多个维度上都能为第二句服务,而没有任何一个维度在起反向作用。

这就是为什么有的比兴给人感觉意涵丰富:它不是单薄地做一次情感铺垫,而是从几个方向同时做支撑。

6. 第五层:支撑取决于整体意图

到这里还没完。支撑是否成功,不能只看第二句。

考虑一首反抗父权的民歌,和一首哀叹命运的民歌,可能用同样的第二句。但作者的整体意图不同——一个是愤怒、控诉,一个是认命、悲叹。那么同一个第一句,对这两种意图的支撑效果就不同。

“六月里黄河冰不化”对”愤怒控诉”支撑得好吗?其中”反常、天理不容”的角度很契合——可以。对”认命悲叹”呢?”冰封、无法化解、命中注定”的角度很契合——也可以。所以它恰好是一个能同时服务多种意图的强图像。

但换一个第一句:”山丹丹开花红艳艳”。热烈、明丽、生命力旺盛。如果整体意图是悲叹,这个第一句就和整体基调反向了,哪怕和第二句局部情绪也许能对上,整首诗还是会别扭。

所以判断一个比兴是否成立,最终要放到作者整体的情感和意图里去看,不能只盯着第二句孤立地判断。

现在,我们可以给比兴下一个定义。

比兴是这样一种修辞技巧:先呈现一个与正文字面无关的意象 A,使其从多个角度唤起联想;紧接着呈现作者真正要表达的内容 B。一个成立的比兴,要求 A 所唤起的联想在作者的整体意图下至少有一个方向与 B 的情感相契合并加以强化,且没有任何方向与之相悖。

这里也可以看出为什么经常“比”“兴”并称:比,比照,比附,对比,都是读者阅读过程中的联想行为;兴,则是作者希望通过这种联想达到的效果,唤起某种体验,对下文的内容起到陪衬、烘托作用。

7. Word Embedding:把词变成向量

2013 年,Mikolov 等人发表了 word2vec 的论文,提出一种把词映射成高维向量的方法。这篇论文在计算语言学里影响极大。它的核心想法很简单:一个词的意义,由它在语料中和哪些词一起出现决定。

具体怎么做不重要,重要的是结果:每个词被表示成一个几百维空间里的点。这个空间有一些奇妙的性质。

最著名的例子:”king – man + woman ≈ queen”。也就是说,从”king”这个向量出发,减去”man”的向量,加上”woman”的向量,得到的点离”queen”最近。这意味着”性别”这个语义维度,在这个空间里是有方向的。

类似地:”Paris – France + Italy ≈ Rome”。”首都”这个关系也是一个方向。

更重要的是,语义上接近的词,在空间里也接近。”冰”附近会有”雪”、”寒”、”冻”、”冷”。”黄河”附近会有”长江”、”母亲河”、”奔腾”、”泥沙”。每个词不是一个孤立的符号,它是一团语义关系的交汇点。

再进一步:一个短语、一个句子、一个意象,都可以被看作这个空间里的一个点,或者更准确地说,一团有方向的区域。”六月里黄河冰不化”不是一个点,它是一个激活了好几个方向的语义结构——反常方向、创伤方向、命运方向。

这就是我们需要的工具。

8. 用语义空间重新定义比兴

现在回到比兴。我们可以用一个相对精确的方式重新表述歌词中的修辞技巧:

歌词中使用的比兴是这样一种修辞技巧:先呈现一个意象 A,使其在语义空间中激活若干方向(v₁, v₂, …, vₙ);紧接着呈现作者真正要表达的内容 B。要使比兴成立,这些方向中必须有一个或多个与 B 在作者整体意图下的情感向量方向一致,起到增强作用;同时,不能有任何方向与该情感向量反向,否则会削弱 B。

几点说明:

第一,A 的字面意义可以和 B 完全无关。鸭子和鹅跟”公家人不知我会唱歌”在字面上没关系。起作用的不是字面语义,而是 A 所激活的向量方向是否与 B 对齐。

第二,A 激活的若干方向不需要汇聚到同一个点。这一点很重要。它们只需要都落在 B 所在的那个情感场域里,都指向作者想营造的那个”场景”。不同方向从不同角度共同托住 B,而不是叠加到一个精确坐标上。

第三,判断对齐要放在作者的整体意图下。同一个 A,配同一个 B,在不同整体意图下效果可能完全不同。

第四,”坏的比兴”就是那些激活了与 B 反向的方向的 A。押韵再好、画面再美,只要有一个显著方向在反向拉扯,整个比兴的效果就有“毛刺”。

用这个定义再回头看前面几个例子,会发现它们都能被干净地解释:

  • “六月里黄河冰不化”激活反常、创伤、命运三个方向,都指向”扭着我成亲是我大”所在的情感区域,没有反向。强比兴。
  • “豌豆圆”激活”极致”方向,与”女儿可怜”的”极致”方向一致。干净的尺度校准。
  • “鸭子和鹅浮水”激活悠然、日常、旁人不察的方向,支撑”公家人不知我会唱歌”里的那种隐秘与自足。

9. 最后

有了这个定义,我们可以说一下比兴对于中文的影响。一旦”用意象间接支撑真意”被确立为一种高级的美学,直接表达就被降级为”浅”。这直接塑造了中国文学乃至日常语言里对”含蓄”的偏好——不说破,让读者在语义空间里自己走那一段距离,被认为才是有韵味的。

《女儿歌》是民歌歌词,使用的语言生动鲜明。《诗经》中的诗歌也有这些特征,但是后世文人创作的诗歌,强化了需要读者进行联想,避免直接表达的特征,所以有“寂寞梧桐深院”,有“枯藤老树昏鸦”等广为传诵的句子。

西方不是没有类似的东西。隐喻、典故、意象并置(imagism)都和比兴有部分重叠。但把”不直接说 B、而让 A 去支撑 B”系统化成一种基础修辞格,并让它深入到民歌、诗词、甚至日常说话方式里,是汉语文学相当独特的一条路径。

而当我们借助词向量这样的工具重新审视它,会发现古人凭直觉摸索出来的东西,其实有清晰的结构。模糊的不是比兴本身,是过去讲它的方式。