利用GIS技术提升中国古代文学研究的数字化水平

  面对数字化技术的日新月异、数字人文(Humanities  Computing)浪潮的扑面而来,我们坐拥着《文渊阁四库全书》、《国学宝典》、《中国基本古籍库》等大型全文检索古籍数据库,享受着古籍文献资料检索空前快捷的便利,我们还能做些什么?数字化技术带给我们古代文学研究的,难道仅仅是海量古籍文献资料的储存与检索,我们能不能利用数字化技术,将古代文学研究的数字化水平提升到一个新的阶段?

  要提升,要突破,先要了解当前古代文学数字化存在的问题,弄清了问题所在,我们才会有明确的方向和具体的方案来解决这些问题,实现新的突破与超越。我个人觉得,目前与古代文学研究相关的古籍数据库,至少存在着功能单一、范围有限的问题。“功能单一”,是说现有的古籍数据库只有检索功能,而没有统计、分析功能,还不能深度挖掘潜藏的信息,不能产生新的知识。“范围有限”,是说现有古籍数据库收录的范围主要局限在原始文献资料方面,没有包括20世纪以来有关中国古代文学研究的巨量成果。虽然有中国知网(CNK)可以检索最新和近期的研究论文,但大量的研究著作还是处在零散的状态,没有集成性的网站或数据库可以便捷地检索利用。

  就作家作品的编年而言,近些年来,已经有了系列的文学史编年著作,诸如赵逵夫《先秦文学史编年》(商务印书馆2010)、刘跃进《秦汉文学编年》(商务印书馆2006)、曹道衡和刘跃进《南北朝文学编年史》(人民文学出版社2000)、傅璇琮《唐五代文学编年史》(辽海出版社1998)、曾枣庄和吴洪泽《宋代文学编年史》(凤凰出版社2010)、杨镰《元代文学编年史》(山西教育出版社2005)、陈文新《中国文学编年史》(湖南人民出版社2006)等。这些编年史,为我们了解各个历史时期文学的发展走向与变化历程提供了丰富的资料和莫大的方便。但受篇幅容量的限制,任何一部断代文学编年史,都不可能把所属时代的作家生平活动和编年作品全部囊括在内。文学编年史只能有选择性地叙述其中部分的作家活动和编年作品。至于已有的大全总集文献如《全上古三代秦汉三国六朝文》、《先秦汉魏南北朝诗》、《全唐诗》、《全唐文》、《全唐五代词》、《全宋诗》、《全宋文》、《全宋词》、《全金诗》、《全金元词》、《全元戏曲》、《全元文》、《全明词》、《全清词》等断代总集,基本构筑出中国古代文学的全景式文献系列(明清文学总集尚不全)。这些大全文献所包含的作家信息资料,也不可能全部融入文学编年史中。

  我们能不能设想,将上述丰富而零散的历代总集、各种文学编年史、相关研究成果中的作家作品编年资料,进行数字化集成,使之既具有检索功能,又具有统计分析功能?

  我们认为:在现有技术条件下,完成这一任务,实现这一构想,是完全可行的。本着这一思路,我们联合相关数字人文领域的专家组成团队,利用地理信息系统(GIS),将我国浩瀚的、静态的、分散的纸质文学史料,进行大规模的数字化集成、发布和地图展示,建立多功能的中国文学数字化地图资源共享平台,以深度开发中国文学宝库中的多元文化价值,适应和满足数字化时代文化建设、学术研究和教学的深度需求。

  中国文学数字化地图平台,将文学纸质史料集成化、数字化、图表化、可视化,具有资料查询、数据统计、地图生成等功能。平台既可以查询中国古今文学家生平和作品中的重要信息,也可以进行分类统计,还可以用电子地图来呈现统计结果。地图可以显示每个时间点和时间段中国各个地方有哪些作家在此地出生、在此地过世、在此地活动和创作;更可以显示一个作家生于何地(或所属籍贯)、在哪些地方活动过,在哪些地方创作了哪些作品、跟哪些人一起交游互动。并能按时间先后顺序自动生成作家行踪路线图。

  这个文学数字化地图平台,跟我们熟知的《国学宝典》、《中国基本古籍库》等古籍数据库最大的区别在于,它具有数据处理生成功能。古籍数据库,是静态的,只能全文检索,不能改变原始资料的结构,不能将原有的资料信息进行自动重组进而生成新的知识信息。而平台则是动态的,能根据用户的需要和指令,自动生成新的知识模块。比如,我们通过编年史或文学家辞典之类的工具书,可以按籍贯查询和统计一个地区历史上产出过多少作家,但我们却无法知道历史上有多少作家曾在这个地区活动和创作,或者某一个具体的时段有哪些作家在这里活动过、创作过哪些作品?而平台可以生成这方面的信息和数据。又比如,通过一个作家的年谱传记,我们可以知道他一生中跟哪些人有过交住、有哪些文坛的朋友,但如果我们要了解同时的几个作家有哪些共同的朋友、作家之间彼此交往的密度和频度,文学编年史和作家个人年谱传记,都不能给我们提供答案,而平台则可以生成这方面的数据和图表。假如我们想要了解苏轼、黄庭坚、秦观、张耒、晁补之五人之间重叠的交游关系,平台能够生成我们需要的网状结果。

  平台建成后,会改变文学史研究的视角、维度和书写模式。

  目前文学史的书写,只有时间的序列性,而没有空间的序列性。我们比较清楚每个时代文学史的历时性变化,但我们不太清楚每个时期文学史共时性的空间分布与变化。有了这个平台,我们就可以了解历史上每个时段作家作品的地域分布与变化。比如,我们想要了解南宋高宗朝环太湖流域、或南宋孝宗朝江西路的文学创作情形,平台会按照我们的要求自动生成这个时段、区域内,有哪些作家在活动,有哪些作家在场,哪些作家在此时此地写了哪些作品,他们的分布状况又如何。有了这些资料数据,对于各个区域的文学面貌及其发展变化,就会了解得更具体和深入。在此基础上进行文学地理学、区域文学和家族文学的研究,才会有具体详实的史料来支撑。有了这个平台,就可以从空间维度全面立体地研究文学史的发展变化。

  还可以利用这个平台从时间的维度进行断面研究,重新审视和思考文学史的阶段性变化。我们可以任意设定不同时代的分期起点、终点,不管是分一期还是几个时期,只要给定具体的年代条件,平台就会自动生成结果,告诉我们每期有多少作家、哪些作家、数量变化曲线等。比如,唐诗,有分三期、四期的,有分五期、六期甚至八段、九段的。我们可以利用平台来观察唐诗作家作品的变化曲线,对已有的各种分期进行检验,看哪一种分期较合理,也可以提出新的分期意见。

  有了这个平台,我们就有可能以十年或二十年为一个周期来观察文学史的阶段性变化。比如盛唐开元年间共29年,这二十九年间作家队伍、作品创作量有何变化,这个时段里,有哪些人进场,哪些人退场,到天宝年间,诗坛又有什么变化?

  对于政治上南北分割时段的文学,平台更有利于进行南北统合的时段观察。如1127-1279年间,北方有金元作家在创作,南方有南宋作家在创作,由于受政治史的影响,文学史的书写和研究,都是南北分开来观察。利用这个平台,我们就可以知道,有哪些作家是同一年进场,哪些作家同时在场,哪些作家在同一年进行创作;1181-1190年辛弃疾在江西上饶带湖闲居创造词史的辉煌时,北方有哪些词人也在书写着词史的新篇章?

  总之,这个平台,可以从时间和空间两个维度上提供多种观察文学的切口和视点,不敢说能引起文学研究范式的革命性变化,但开拓文学史研究的新空间、新的增长点,将是完全可以预期的。

  平台将十分注重史料数据的可靠性、准确性和科学性,着力打造一个具有与纸本文献同样可靠可信的数字化地图平台,改变网络电子资料不可信据的局面。

  

Comments are closed.