古籍数字化学科的建设

葛怀东
(金陵科技学院人文学院 江苏南京 210038)

  摘 要:古籍数字化促进了古籍整理事业的繁荣,也催生了对学科建设的整体需求。文章讨论了建设古籍数字化学科的迫切性和研究基础,对古籍数字化学科的研究对象、学科性质也进行了初步界定,并提出了作为学科理论研究的主要内容,以期构建古籍数字化学科的理论框架。

  关键词:古籍保护;古籍数字化;学科建设;古籍整理

 

  卷帙浩繁的古典文献是我们祖国宝贵文化遗产的重要组成部分。古籍本身所具有的历史文物性、学术资料性以及艺术代表性,在研究中国古代的社会面貌以及生产、科学的发展历史方面具有十分重要的作用。所以,我们不仅应该好好保护之,更应该充分利用这一资源。从20世纪80年代起,我国就开始尝试中文古籍的数字化,经过近30年的探索与开发,已取得了较为显著的成果。古籍数字化有效地保存了现存古籍资源,并借助信息技术挖掘其中隐含的知识内涵,为古籍的开发利用奠定了基础。

  伴随数字化古籍在学术研究和文化建设中的广泛应用,古籍数字化本身所涉及的诸多问题也引起了文史研究界和IT界人士的极大关注。在这其中,将古籍数字化作为一门独立学科体系来研究,是摆在我们面前的一个崭新的课题。

  1.古籍数字化学科建设的紧迫性

  信息时代,古籍正在成为重要的数字资源。古籍的数字化是古籍信为文献资源发展为信息资源的必然趋势。作为一个文献实体,古籍囿于载体的限制,而信息资源则不会拘泥于载体本身,其应用前景是十分广阔的。因此,借助数字化技术,传统的古籍文本翻开了新的历史篇章。

  数字化也是古籍发挥其传统文化影响的现实选择。一方面,岁月的流逝、兵火人患、纸质老化等,造成古籍在流传过程中多有残缺、漫漶,流传下来的孤本、珍本、善本已难以适应读者的直接或反复地查阅;另一方面,古籍如何摆脱旧有的“高深莫测、查检繁琐”的印象,拉近传统习得与现代人的距离,古籍数字化会是一个很好的出路。

  古籍数字化是保护和传承古文献最有效的形式,也是古籍整理工作的必然趋势。作为一个正在发展和成长的研究领域,我们要看到古籍数字化的理论体系还存在着许多不足。也正因为缺乏古籍数字化理论上的指导,才造成了当前古籍数字化在理念上的千差万别、数字产品质量上的参差不齐、古籍成果评判标准各自为营的局面。因此,要想引领传统文化保护的潮流,创建符合时代需求的古籍数字化学科体系,就显得十分迫切了。正如史睿先生在《试论中国古籍数字化与人文学术研究》一文中所指出的,“古籍数字化的理论问题比技术问题更为重要,因为一旦理论发生了偏差,技术越高明,则解决方案越是难以成功。”[1]

  古籍数字化学科的创建,将能为古籍的数字化提供新的思想、观点和方法,也只有在古籍数字化学科理论的正确指导下,古籍数字化的实践才会有正确的指向与评价标准,才能少走弯路。同时,古籍数字化学科的创建,也标志着人们对古籍数字化的认识由感性上升到了理性,丰富和发展了古文献学学科体系,促进古籍整理事业的繁荣。

  2.古籍数字化学科建设的基础与现状

  信息时代,计算机技术与通讯技术的发展不断地改变着社会的生产方式和人们的生活方式。Internet俨然已成为了信息传播的主要媒介。作为一种全新的文献存在形式,数字化古籍经过短短十数年的发展,已经向我们展示了其强大的生命力与广阔的应用前景,同时也提供了一个新兴交叉学科的发展契机。

  2.1 技术手段驱动古籍数字化的发展模式

  古籍的数字化主要是通过利用现代信息技术,对古籍文献进行加工、处理,形成大型资源库,用以揭示古文献中所蕴涵的信息资源。随着信息技术高速发展,数字化、网络化、古籍数字化的相关技术已逐步成熟。在当前公开的古籍数字化项目中,无论是数量还是采用的技术手段,古籍数字化工作所取得的成就都是十分突出的。

  从数字化古籍文献利用的角度看,信息化的古籍产品呈多元、自主开发的态势,这样就使用户获得了更为广阔的阅读、科研空间,从而改变了传统查检方式与学习模式。可以说,引入数字化技术是古籍再生性保护的必然趋势。

  2.2 古籍数字化基础理论研究的缺失

  与古籍数字化技术研究相比,古籍数字化理论的研究则相对薄弱,尤其是系统理论缺乏。当前,有关古籍数字化的研究过多地集中在对古籍数字化资源的调查和利用方面,深层次的理论探究的涉及较少,即使有也多是一笔带过,更多的仍是技术方面的盲从。对于古文献资源来说,古籍数字化只是技术手段上的革新,其本质上仍然属于古籍整理的范畴。古籍的数字化也面临着版本的选择、文字的校勘、文献的考证等古籍整理的基本环节,所以从事古籍数字化工作的相关人员同样要具备古文献学的基本知识。

  从古籍数字化的长远发展来看,技术不再是问题,理论体系的构建才是关系到古籍数字化方向的关键性问题。

  2.3 古籍数字化工作中的学术队伍建设

  一方面,由于古籍数字化的应用前景,相关科研机构、高等院校、商业公司多以着手古籍数字化项目的开展,但也带来选题重复、资源浪费、效率低下等问题;另一方面,从事史学和古代文献研究的学者大都认为数字化的古籍很有用处,而真正投身古籍数字化规划项目事业、推动古籍数字化进程的学者却多是图书馆、信息管理学界的人士。这种状况极大地制约了古籍数字化学科的建设与发展。

  回顾近年来古籍数字化的经验教训,探索古籍数字化的特点和运作方式,推动古籍数字化与文史学科发展的紧密联系,是摆在IT业者和文史工作者面前的共同命题。

  3.古籍数字化学科的研究对象与学科性质

  3.1 研究对象

  每一门学科都有自己特定的研究对象。确定研究对象是一个学科成立的根据和发展的逻辑起点。“古籍数字化”是指以古籍为对象进行的数字化工作,它包含了两个基本要素:一是“古籍”,二是“数字化”。[2]我们在探讨“古籍数字化”的研究对象时,就必须从这两个基本要素以及二者的结合上入手,并考察古籍数字化是否具有特殊的研究领域。

  作为文献的一种类型,古籍的数字化与其他文献的数字化相比,有共性,但也有其个性。古籍的个性体现在其特殊的外观和历史文物价值上。为了体现这些个性,需要我们采取一些特殊的加工手段和技术措施。因此,根据古籍的特点来进行数字化是“古籍数字化”学科的研究对象,更是提高古籍数字化水平最主要的途径。

  古籍数字化应该根据古籍的特点来进行,并通过数字化的操作过程使古籍中所包含信息进行重组。将古籍的特点与数字技术的特点相结合,既要充分考虑到古籍本身所具有的特点,让经过数字化处理后的古籍保持原有的文化特征与内涵;同时又考虑到数字技术及信息处理技术对文本和信息处理的过程,让后者所具有的信息分析、聚类以及海量信息处理等优势得到充分发挥,使过去必须用人工进行处理的事情甚至是人工不可能完成的事情让计算机来处理,实现从古籍影像的数字再现到古籍内容的分析、聚类,从单种古籍内容的处理到海量文献的综合处理,从简单的文本转换到信息重组甚至知识挖掘,这将是今后古籍数字化学科重要的研究领域。

  3.2 学科性质

  作为古籍整理事业在新时期的拓展,古籍数字化吸收了目录学、版本学、校勘学、计算机科学等多学科的研究成果和方法,博采众家所长,以全新的视角将古籍作为一种数字信息资源,动态地展示在人们面前,诠释传统古籍与人类社会文化繁衍之间的交互关系。

  古籍数字化的目的是十分突出的,即是对古籍或古籍内容的再现和加工,是古籍整理工作在新时期的延伸。因此,很多学者都据此将古籍数字化归为古籍整理与学术研究的范畴,这仍然是针对实践层面所提出的。

  古籍整理是对古籍原文的整理加工,以便于人们阅读与研究。从学科体系上看,古籍整理从属于文献学,黄永年曾说过文献学“把整个古籍整理工作统统包括了进去,可见文献学全部内容之庞大”。[3]从现在的古籍数字化产品选题来看,也包括了甲骨、金石等文献资源载体,这也符合古文献学的研究内容。因此,将古籍数字化定位于古文献学的分支学科,使之从文献学与信息技术交叉的角度来审视古籍整理领域中特有的现象与规律,并形成一门具有边缘性色彩的交叉学科,意义十分重大。

  古籍数字化的重点在于计算机技术同古文献学的融合,它不是简单的拼凑或叠加,而是融合原有基础上的提高与升华,并且会随着时代的发展而变化。从古籍数字化的角度来看,是研究新技术、新环境下的古籍整理的问题;而从信息技术的角度来看,是研究、拓展数字技术在古文献学中的应用。因此,古籍数字化实际上要涉及到古文献学、古籍整理、信息学、计算机科学与技术、现代通讯技术等诸多学科领域,具有十分明显的跨学科性质。

  通过上面的分析,我们认为对古籍数字化学科可以这样描述:古籍数字化学科是研究古文献在数字化、信息化过程中的特质和规律,指导数字技术在古籍整理领域中的应用,以优化信息环境下的古文献学科研究领域。

  4.古籍数字化学科的研究内容

  古籍数字化不仅是技术条件下的古籍整理方式的一种尝试,更在于它是一项跨越在自然科学和社会科学两个科学领域上的系统工程。为了实现旧有典籍的数字化进程,古籍数字化涉及众多学科知识的融合,并将形成具有自身特色的理论体系和结构框架。

  古籍数字化学科的建设与发展需要有一个过程,其初创期可以着眼于以下三个方面:

  4.1 数字化古籍整理学

  古籍数字化是一项复杂的系统工程, 不仅仅是文献载体的转换,还包括对古籍的版本考证、文字校勘、史实考订、目录编纂等工作,其制作过程的本身仍然是对古籍进行整理。可以说,整理工作的好坏决定着古籍数字化的质量优劣。因此,数字古籍也必须遵循古籍整理的一般过程和相应规则,而探究技术条件下古籍整理的独特规律将有助于古籍数字化的进一步研发

  4.2 中文信息处理技术

  中文信息处理技术,是我国特有的、利用计算机系统来处理中文信息的技术,发展至今已取得了不小进展。但古籍文本的信息处理,既包含古籍外部体式或内容的数字转换和再现,如页面的扫描、文本的数字化转换、光学字符识别以及版式还原等,还包括文本数字转换后的应用,如智能检索、内容关联等。其共性与个性的把握,需在中文信息处理范围内专门引入特定的古籍处理范式。

  4.3 古籍数字化管理理论

  古籍数字化的管理理论是指对古籍数字化实践活动的全过程实行有效调控的理论。它涵盖了对古籍数字化成果及产品的预测、决策和评价的研究,古籍数字化的管理体制和开发机构的研究,古籍数字化从业者的素质及技能的研究等。针对古籍数字化而进行的管理活动,不仅仅是为了提高古籍数字化实践活动的效率,更在于通过有效的管理使古籍数字化更好地服务于广大用户。因此,必须加强对古籍数字化管理理论的总结研究,以给古籍数字化管理的实践提供强有力的理论支持。

  5.结语

  古籍数字化不能只着眼于数字技术,也不仅仅是市场运作,它更加深刻的内涵在于数字技术所承载的内容,这需要通过学科建设这一途径来完善相关理论体系,从而折射出古典文献在内容上对于人们的使用价值,并成为活着的文化生命与民族精神资源。

参考文献:

[1]史睿.试论中国古籍数字化与人文学术研究.国家图书馆学刊,1999(02):28-35

[2]陈力.中文古籍数字化的再思考.国家图书馆学刊,2006(02):42-49

[3]黄永年.古籍整理概论.上海:上海书店出版社,2001.10

发布日期:2009-08-18