从比兴到 Word Embedding

翻开任何一本讲中国古典文学的教材,你都会遇到”比兴”这个词。然后你会发现:几乎没有哪本书真正把它讲清楚。

朱熹说:”比者,以彼物比此物也;兴者,先言他物以引起所咏之词也。”这是最常被引用的定义。听起来好像说了什么,但你真的理解”引起”是什么意思吗?引起什么?怎么引起?为什么有的”先言他物”让人拍案叫绝,有的却显得生硬无关?不仅仅是教材里止步于此,讨论比兴到底是什么的论文,其实也有不少,可见其含混程度。

这种含糊不是偶然的。一方面,中国传统的文论本来就崇尚”不可说”、”只可意会”——玄妙被当作深度的标志,讲得太清楚反而被认为肤浅。另一方面我怀疑,相当一部分作者其实并没有真正想清楚自己在说什么,只是在重复前人的话,把定义传给下一代,谁也没停下来追问一句:”等等,这到底是什么意思?”

当然了,从来都不乏能够熟练使用比兴手法的作者,他们对什么是比兴肯定是非常清楚的,但他们的技巧很可能来自于反复的模仿和锤炼,而不是理论提炼,自己也很难说清楚。于是”比兴”就成了一个在教科书里被反复讲解、却始终模糊的概念。

本文想做的事情很简单:借助一点现代计算语言学的视角,把这个古老的技巧讲清楚。

继续阅读从比兴到 Word Embedding