于溯：要怎样才能像杜甫一样写诗

源济 · 发表于 2017-3-26 08:37 AM

于溯：要怎样才能像杜甫一样写诗

原创 2017-03-26 于溯大家

文 | 于溯

我在大学教了几年古代文学，发现对这门课，年轻的学生们往往有不切实际的幻想。外专业的学生觉得诗词歌赋就是风花雪月，适可作为做实验写代码背公式的调剂，欣然定为跨专业修学分的秒选。本专业尚未入门的学生以为诗词歌赋就是背背文学常识——李白是飘逸的，杜甫是沉郁的，二十个形容词可以囊括两千年的作者，助人从大学一路考到博士。我常想，若这就是中文系的日常，则大学不如取消这个专业。但凡识字的人，穿个汉服，戴个手串，喝壶小酒，挥把小扇，临风陨行泪，对月伤番怀，吟上句人生若只如初见，不也低成本地满足了内心中的文学幻想了吗？

是的，每个人都有欣赏文学的权力，但并不是每个人都有研究文学的能力。中文系期待的，从不是充满文学幻想的文艺青年或死记硬背的学霸，而是思维清晰、逻辑严密的研究者。如果一个人高数和逻辑学学得还可以，又很热爱艺术的话，那学文学再合适不过了——因为文学作为研究对象是一门艺术（不能靠背），而通向文学的研究方法却必然是符合学术伦理的（不能靠吹）——逻辑严密是最基本的学术伦理。喃喃私语式的言说，超凌文本的顿悟，这属于文学对个体生命的影响，我们感佩文学对人生产生的这种力量，但这和研究文学，终究是两码事。

一个作者写下一首诗，可能是出于某种感动；但他写出的是这样一首而不是那样一首诗，则是他所拥有的技术决定的。我们对生活的感触未必比杜甫少，我们对山山水水的热爱未必比王维少，我们之只能发圈吐槽、拍照留念，盖因不曾习得杜甫和王维的那种表达技术而已。舍技术而谈感动，那是普通的读者；懂技术而不忘感动，才是文学研究者。

然而文学爱好者，也包括一些文学研究者，常怀有一种古老的傲慢，觉得技术分析是低端的、匠气的，同时也对一些“技术手段”的“入侵”，抱有相当警惕。其实在科学主义大行其道的时候，大家也曾热情地拥抱过表格和数据，甚至有的时候，拥抱的姿态还因过于急迫而有失优雅。然而此一时也彼一时也，就像当年的父母逼孩子读《十万个为什么》，如今的父母逼孩子背四书五经，大趋势下，与文学研究者本来就八字不合的各种技术手段，难免日见冷落。所以我常怀疑，一种研究方法在国内流行，大概得同时满足两个条件，一是与国内的大环境合拍，二是由国外舶来。就像近年低温发酵的大数据挖掘，因为只满足了后一个条件，在人文研究领域能不能小成气候，实在是未可逆知的。

想到大数据，是因为偶然看到网上有个帖子，叫《计算机告诉你，唐朝诗人之间的关系到底是什么样的？》（以下简称《诗人关系》），因为和我的工作相关，不免颇感兴趣。这个研究的思路，大致是通过哈佛大学编纂的《中国历代人物专辑资料库》（China Biographical Database Project）提供的诗人名号数据，对四万多首唐诗呈现的诗人间引用关系进行计算，以此构拟唐代诗人的交际网络。正如网上一些评论所说的，作者通过数据挖掘这新技术，最终得到的结果却大致符合现有的文学史认知。不过在我看，符合文学史既有认知，不等于研究无价值，这种吻合，既是互相检正，也说明由于唐诗的总量不大，计算机处理这些数据并没有明显超过人脑的优势——如果换成清诗，我倒是很相信它捕捉到文学史所未曾关注过的小规模社交现象。

我并不觉得《诗人关系》是一个尽善尽美的研究。有些处理，比如先将唐诗分为时长极不平衡的四期（即唐代文学史研究惯用的“初盛中晚”），再去逐一计算——如果不是避免单次计算量过于庞大而不得不如此的话，最好还是不要在研究前就先受文学史既定框架的干扰；同时，《诗人关系》可能还忽略了同场作诗而并未互引的情况。举一个简单的例子，肃宗乾元元年（758）贾至写有七律《早朝大明宫呈两省僚友》，现并存王维、杜甫、岑参三人和诗。后三者的诗题和文本都没有互相引及，因此在《诗人关系》制出的关系图中，也失落了王维和杜、岑的关系。

另一方面，对数据样本本身的其特性也需要做前期分析——比如早期文献完整性往往很差，像唐诗的亡佚问题（以《早朝大明宫呈两省僚友》为例，也许当时和作不止三首）就会干扰最终结论；同时，对作者想实现的目的而言，唐诗文献这个样本自身也并不充足（两省僚友中很难说只有三位诗人，不管他们这次有没有和诗）。要之，诗作的往还，并不是诗人交往的唯一方式，又何况诗作亡佚甚多。应该说，作者的工作只是为研究唐代诗人交往情况做了一些前期准备，提供了一些可以进一步分析的数据，而全部工作还远没有完成。但我认为以上这些问题，应该责之文学研究者去解决，而不应该责之为我们提供这个方法的人。打个比方，当文学研究和数据挖掘相遇时，他们的关系就好比医生和设计医疗器械的工程师，各自都要对对方的工作懂一点，才好相互合作，但谁也不可能取代谁。

不错，大数据是把好用的柳叶刀。《诗人关系》的作者还用这把刀做过唐诗用字、用词（季节、颜色、植物、动物）等数据分析（《当我们在读唐诗时，我们在读什么？》，下面简称《读唐诗》）。如果说《诗人关系》是对文学的外部研究的话，《读唐诗》则是文学文本的内部分析。这种分析取径也是古已有之，我们说杜甫喜欢用万里、乾坤、日月之类的大词，李贺喜欢用各种颜色，这都是古今文学研究者总结出来的文学现象。所谓总结，其实就是一种算法，通过这种算法，我们能把握诗人创作的某些特点。我读大学的时候，我的老师考学生的一个办法，是找几首名家写的不那么常见的诗（相对于本科生的阅读量），让大家猜作者。猜，其实就是对诗人的用词、语法、章法习惯的一个综合计算。而古人习诗，特重拟作，模拟一篇作品，其实和读作品猜作者一样，也得先对诗人的用词、语法、章法习惯做综合计算。

所以说，文学美，但并不玄。人人知道太白斗酒诗百篇，太白可是把《昭明文选》反反复复拟作过三遍呢。这样看所谓斗酒诗百篇，不过是说做过无数套模拟题的学霸在醉醺醺的情况下仍能考好罢了。

据说阮籍的《咏怀》，“可以陶性灵，发幽思。言在耳目之内，情寄八荒之表”，很玄的样子，就像“夜中不能寐，起坐弹鸣琴。薄帷鉴明月，清风吹我衿。孤鸿号外野，朔鸟鸣北林。徘徊将何见，忧思独伤心”。可它和这样一首诗——“独夜不能寐，摄衣起抚琴。迅风拂裳袂，白露沾衣襟。孤雁飞南游，飞鸟翔故林。形影忽不见，翩翩伤我心”像不像呢？后一首可是我拿曹植、王粲的诗句乱拼的。所以说阮籍也是打开数据库写诗的，三曹七子汉乐府，这些都在他的数据库里。创作、研究的这种“数据库现象”，正是计算机可以介入文学研究的方法论基础。

无可否认，计算机比人体更适合处理海量数据，因此特别长于探索一些宏观的、结构性的东西——比如诗人团体构成、地域分布、阶层分布，它们在某个时间点呈现的静态图景，或者在某个时间段呈现的动态走势。而计算机的另一个长处是实现分析结果的可视化，我有时就在课上展示不同诗人的词云来让学生猜作者，学生会觉得很酷，而且很容易记住诗人的用词偏好，还能发现谁爱重复用词（就是词云图中出现的那些字号巨大的词）、谁更有避复的意识；我又想过把杜甫的诗按他的行迹标注在电子地图上，这样就是一个杜诗的生成地图，甚至可以进一步做成app，点击一个地点，作于此地的诗就弹出来，读者可以跟着杜甫，重走他诗人的一生。

▲ 阮籍的词云

▲ 武汉大学文学院王兆鹏教授与搜韵共同打造的唐宋文学编年系地信息平台

但是计算机处理文学问题，当然也有它的能力边界。围棋纵横19道，一局能布多少子？而写一首五绝，有上万汉字供你选择，调换一个字，变换一个位置，其间都大有文学消息。用推还是用敲？用木叶还是树叶？用建康还是金陵？为什么诗总写到长江无尽东流，换成黄河行么？“春与猨吟兮秋鹤与飞”和“春与猨吟兮秋与鹤飞”有什么不同？“清明时节雨纷纷，路上行人欲断魂。借问酒家何处有，牧童遥指杏花村。”为什么不能写成“清明时节雨，行人欲断魂。酒家何处有，遥指杏花村”？这些问题，不是因为玄，而是因为算法太复杂，足以让阿尔法狗无用武之地。如今也有所谓作诗软件，你却并不能指望它写出一首真正的好诗；同样地，你也不能指望计算机完美地分析一首诗。解铃还须系铃人，人写之，人解之，毕竟文学的逻辑和文学的文化，是无法完全数据化的。

所以我总觉得，大数据挖掘，搭建数据库固然重要，但更重要的是，我们要能提出在没有数据库之前提不出的文学问题——把老问题投给计算机去研究，通常不会得出什么新结论，充其量是把旧结论更精密化而已，这也是《诗人关系》和《读唐诗》上明显带有的问题。我期待大数据能引发一些新的研究视角，不过，即使引发不来，它也是比手串和汉服更真诚的接触文学的方式。

【注】本文原标题《文学不是科学，但更不是玄学》，题图为杜甫

【作者简介】

		自动登录	找回密码
密码			注册

[哲史艺丛] 于溯：要怎样才能像杜甫一样写诗

于溯：要怎样才能像杜甫一样写诗

于溯 | 腾讯·大家专栏作者，南京大学文学院讲师。