文化人 天下事
正在阅读: 以大数据“全景式”呈现唐诗宋词
首页> 光明日报 > 正文

以大数据“全景式”呈现唐诗宋词

2019-01-21 02:35来源:光明网-《光明日报》

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  一场读诗方式的创新——

以大数据“全景式”呈现唐诗宋词

光明日报记者 王子墨 王远方 卢璐

  “问汝平生功业,黄州惠州儋州。”苏轼曾给自己做了这么个总结。但是苏轼一生到底有多颠沛?光看文字可能不太好想象。但是打开《唐宋文学编年地图》,输入“苏轼”,一张中国地图上被密密麻麻地标记了位置。这张地图,就是一张直观生动的“苏轼颠沛流离图”。

  2017年3月,中南民族大学文学与新闻传播学院教授王兆鹏牵头打造的《唐宋文学编年地图》上线。在这张地图上,既可以查出唐宋时期某位诗人一生的足迹与作品,也能查出一个地方曾接纳过的所有诗人。该产品突破了唐诗宋词文字阅读的“套路化”模式,变成了直观生动的地图展示,一上线即收获广泛关注。最初上线的前两天,点击量超过220万。《唐宋文学编年地图》为何会产生这么大的影响?新版本又有哪些变化?记者就此进行了采访。

  读诗方式的创新

  “我当年写博士论文的时候,就考虑能不能用统计学的方法解读唐诗宋词,进行定量分析。那个时候没有计算机,就是靠人工录入。”王兆鹏用大数据解读唐诗宋词,并非一时突发奇想,而是贯穿在他一直以来的学术脉络中。

  在《唐宋文学编年地图》之前,王兆鹏及其团队曾有一部著作引发了不小的舆论争议——《唐诗排行榜》。该书运用统计学的方法得出了一份唐诗前100名的排行榜,其中排在榜首的是崔颢的《黄鹤楼》。

  “当时很多人不理解,觉得‘文无第一’,诗怎么可以排行呢?其实仔细阅读这本书就知道,这本书主要是还原文学评价的历史情境,哪首诗被历代文人最多地提起、引用、编入选本,这些都是有据可查的。排行榜是用数据得出的‘结论’。它不是对一首诗的价值评判,而是对一首诗影响力的评估。”

  而这本书也进一步启发了王兆鹏:诗,不一定只是纸面诵读,还可以运用大数据,走进历史场景之中,还原当时的文学图景,进行一场读诗方式的创新。“名诗是一棵棵树,而还原历史,则是重现那片森林。”

  之后,王兆鹏带领学生们与搜韵公司合作,参与的人数超过100人,历时5年,开发出了《唐宋文学编年地图》,一上线就反响不错。“直到今天我们还在不断维护,在后台添加数据。唐宋文学的数据量太大,必须不断更新。”

  经过一年的运营与总结,王兆鹏又计划着对文学地图进行一次更新,让唐诗宋词不仅能读,能看,更能“走进”。

  “全景式”呈现唐诗宋词

  虽然《唐宋文学编年地图》反响不错,但也收到了一些意见,如页面卡顿、界面单调等等。除了改进这些用户体验上的问题,王兆鹏还有更多考量。

  “就像一句‘江流天地外,山色有无中’,我们今天读起来觉得是好诗,但是如果能走到那个地方去,就会发现风景确实和诗人描写的是一样的。这时就会发现不只是诗人写得好,而且风景就是如此,如果知道这些,对解读一首诗必然大有帮助。”

  王兆鹏希望改进后的地图,可以“全景式”呈现唐诗宋词。“比如在地图上点开一首诗,除了文字信息,还能弹出场景画面,重现诗人写作时看到的自然景观。像李白的‘两岸青山相对出’,诗人为什么这么写,一看图片就明白了。”

  为了实现这一目标,王兆鹏及其团队,与市场上的数据公司合作,不断改进。王兆鹏在采访时除了诗词名句,还不时冒出编程的专业术语,对各类技术名词信手拈来。“我是研究古典文学的,但一点也不排斥技术。当今的技术手段能够极大地丰富我们对传统文学的解读方式,古典文学的学者应该多了解新的信息技术。现在的技术进步太快了,没有做不到,只有想不到。理解了技术的逻辑,会给我们的研究视野带来极大的拓展。”

  预计2019年年中,新版本的《唐宋文学编年地图》将会上线。“原本《唐宋文学编年地图》主要是想面向学术界,新版本将更多面向大众,优化一般网民的使用体验。这将是一个尊重市场规律的产品,增强体验感。古典文学不只是一种读物,也能变成有科技感和现代感的产品。”王兆鹏这样介绍。

  数据库自主权要掌握在自己手中

  如今,王兆鹏考虑最多的还有一事——数据安全。“怎样防止别人入侵我们的数据库、扒走我们的整理成果,我们花了大量精力来做这件事。整理一个数据库的劳动量非常大,但被别人‘黑’走却是分分钟的事。”

  王兆鹏使用了诸多技术办法,来给数据加密,“安全”,是王兆鹏在其团队里经常提起的词。

  也正是在提升数据库安全性的过程中,王兆鹏发现了将数据库掌握在自己手里的意义。“现在包括中国文献在内的诸多数据库,其所有权都在国外。现在的学术研究,谁掌握了数据库,很大程度谁就拥有学术自主权,别人就可以来定义你的文献价值和学术走向。我在整理数据的时候,深感我们在数据库方面的薄弱,甚至是中国古典文学,有不少数据库都在国外。”

  王兆鹏希望,借着梳理文学地图的契机,能够打造一个翔实、全面、具备学术价值的数据库。“因为我用定量分析的办法研究古典文学很多年,其实也暗自憋着一股劲儿,想做出一个优质的、属于中国人的数据库,争得一份学术自主权。”

  《光明日报》( 2019年01月21日 08版)

[责编:王丽媛]

阅读剩余全文(