古籍数字化工程必须尽快实施国家整体调控

  我国的历代典籍整理和研究工作起步较早,几乎与新中国同步:1958年,即成立由齐燕铭任组长的“国务院科学规划委员会古籍整理出版规划小组”(文革后改名国家古籍整理出版规划小组);1983年教育部成立了以党组副书记、副部长周林为主任的全国高等院校古籍整理研究工作委员会,负责组织、协调中国大陆高校古籍整理的科学研究与人才培养工作;1984年又成立了全国少数民族古籍整理出版规划小组,卫生部也成立中医古籍文献学术委员会,负责指导和研究中医古籍整理工作。制订了中医古籍整理出版九年规划,计划整理686部中医药古。从1991年起,国家古籍整理出版规划小组开始陆续制定《古籍整理出版十年规(1991-2000)和“八五”计划》、《“十一五”(2006—2010年)重点规划》和《2011-2020年国家古籍整理出版规划》。与此同时,各省、市自治区也先后成立相应的古籍整理出版规划小组,负责制订各地方古籍整理计划,组织古籍研究、人才培训和出版工作。但古籍整理和研究的数字化却相对滞后:直到2006年4月,全国古籍整理出版规划领导小组制订的《国家古籍整理出版“十一五”(2006—2010年)重点规划》才提到“运用现代技术,开展古籍数字化、影印出版和缩微工作,促进古籍的有效利用”;2010年制定的《2011-2020年国家古籍整理出版规划》,分为目标、重点、特点、实施《规划》的要求和保障措施四大部分,皆未提到古籍数字化及在古籍整理中的地位和作用。只是在所附的古籍整理目录九大类491个项目中,第九类列有“古籍数字化”的20个项目,约占全部项目的4%。据杨家骆先生1946年统计,仅西汉前至清末的古籍就有181755部,还不包括不在其中的方志、家谱,近来出土的文物、碑刻、简牍、壁画、墓葬品以及一些古籍研究类代表性专著研究类著作。据王鹤鸣《中国家谱总目》中介绍,目前全国共发现家谱就有52401种。按这样的速度,完成国家一级的古籍整理需要九千多年。古籍数字化是一个新生事物,他给人们的阅读方式、研究手段乃至思维方式都带来重大的甚至是革命性的变化,计算机强大的储存空间和自动检索功能,将彻底改变人脑记忆的限度,这必将使人脑解放出来用于更多的抽象思维活动。因此,古籍数字化不仅对古籍的保存、使用有着巨大的价值,给文史典籍的读者、研究者带来极大的便利,代表着古籍保存、使用、阅读和研究的发展方向,而且对振兴中华、实现文化复兴乃至实现强国梦,也有着不可取代的意义。按目前的国家一级的古籍整理规划所设定的目标和整理进度,与党的十八大提出的目标:“新中国成立一百年时建成富强民主文明和谐的社会主义现代化国家”,其差距难以道里计。

  况且,古籍数字化是一个浩大的工程体系,其读者与生产者、生产者之间、电子产品与纸质产品、古籍与数字化古籍之间涉及的问题很多,自1991年武汉大学图书馆学情报学研究所陈光祚教授主持的电子版出版物——《国共两党关系通史》由武汉大学出版社出版以来这二十多年间,已经发生和并在不断产生许多新的问题,涉及对现有的古籍资源调研、规划、整理、出版和人才培养这样一个涵盖各有关领域的中长期规划;规范、统一的数据库的标准设置和建设,一系列兼容、通用的计算机处理软件的研制和开发;针对性更强、有利于古籍数字化的法律法规的调研和制定;调动各级各类古籍数字化整理和生产部门的积极性,又做好其中的协调和监控等等。而现有的国家古籍整理出版规划领导小组仅仅是限于古籍整理的规划和出版。小组下设的办公室,则与新闻出版总署图书管理司为一个机构。也就是说他的工作范围,多限于出版领域,而上述问题的研究和解决,则需要教育部、科技部、科研院所、司法部、信息产业部、各大博物馆、图书馆等介入和参与,皆需要这些部门的的配合和相互协调。因此由此看来,建立一个国家级的更权威、联系更广泛、也更专门化的古籍数字化管理机构,或是对现存的国家古籍整理出版规划领导小组进行改组充实,尤其是加强古籍数字化方面的力量,由上述各部门的代表、古籍专家、技术专家、高校和公共图书馆的专家以及一些从事计算机网络营运的商业机构代表组成,实行对现有的古籍资源调研、规划、整理、出版和人才培养等在多元化基础上实行国家整体调控,是完全必要的而且是非常迫切的。这个机构的组成,他的组织体制、知识结构和运作模式在某种程度上对于我国古籍数字化的成败将起着关键和枢纽作用。因为下面几个关系到古籍数字化工程的生存和发展的重大问题,都必须依靠国家统一管理和调控才能发做到、做好:

  一、摸清家底,制定国家的古籍数字化工程中、长期规划

  我国古籍数字化的开发必须首先摸清家底,我们到底有多少资源?这些资源的分布情况?有多少散失在海外?海外中国古籍珍本究竟有多少?国家和社会多少资金可以投入和利用?古籍数字化到底该先进行什么项目,中国古籍数字化的基地和研究骨干都有哪些?他们都各有什么优势?如何使他们的优势得到互补?如何协调它们之间的矛盾等等。这些摸底工作,有些部门也开始启动,如上述的国家古籍整理出版规划领导小组从2009年8月开始全面梳理我国古籍资源,开列古籍整理基础性出版项目,系统性地影印复制国内未见或稀见的重要古籍等;科技部重大基础课题—“我国数字图书馆标准规范建设”;由北京大学中文系李铎博士承担的教育部“十五—211工程”项目子项目“《全宋诗》分析系统”等。但基本上是各部门、各系统、各单位各自为之的“战国局面”,缺乏一个涵盖各部门一个全国性的总体规划和具体安排。我国的古籍文献浩繁,且分布在不同系统和部门的图书馆及其它机构。就海外汉籍而言。且不说众人熟知的散落于英国国家图书馆和国立巴黎图书馆的敦煌典籍,已收藏中国典籍文明闻名的美国国会图书馆、哈佛大学图书馆。就日本收藏的中国古籍而言,就散见于京都大学人文科学研究所图书馆编印的《京都大学人文科学研究所汉籍目录》、东京大学东洋文化研究图书馆编印的《东京大学东洋文化研究所汉籍目录》、早稻田大学图书馆编印的《早稻田大学图书馆所藏汉籍分类目录》、日本内阁文库编印《内阁文库汉籍分类目录》、日本宫内厅书陵部编印的《帝室和汉图书目录》、日本国立国会图书馆《国立国会图书馆汉籍目录》、东洋文库编印的《东洋文库汉籍分类目录》、静嘉堂文库编印的《静嘉堂文库汉籍分类目录》、《静嘉堂文库汉籍分类目录续篇》、《静嘉堂文库宋元版图录》,尊经阁文库编印的《尊经阁文库汉籍分类目录》等。近日又有日人金文京、乔秀岩主编《日本所藏稀见中国戏曲文献丛刊》,由广西师范大学出版社出版2006年出版,共十八册,收录了四十多个剧本。介绍了该种戏曲在日本的收藏地点,在中国的原来收藏者,及其版本格式以及各种书目的著录概况。国内则有北京图书馆编印的《日本藏汉籍善本书志书目集成》(十册),台湾中央研究院中国文哲研究所林庆彰主编的《日本研究经学论著目录》、《日本儒学研究书目》,这都需要统一梳理整合,才能真正全面了解我国古籍在日本收藏和流传情况。至于韩国延世大学全寅初教授主编的《韩国所藏中国汉籍总目》,收录整理韩国70余种韩国古籍书目所刊载的12500多种中国典籍。2005年由韩国学古房出版后,仅为台湾以及大陆部分同行友人所知中。如果我们首先不摸清家底,在此基础上制定一个全国性的典籍数字化长远目标和总体规划,以及实现这个规划的路线图,我们的制度优越就无法发挥,我们国家队的实力就无法体现,必然也会影响到中华优秀文化的传承和民族复兴的历史进程!

  我国台湾地区汉籍数字化(台湾地区称为“数位化”)进行较早,它们在统一规划方面有些经验值得我们借鉴参考:1984年,台湾最高学术机构中央研究院即开始制定“史籍自动化计划”,1998年“数位博物馆专案先导计划”开始启动,有关部门有计划地规划文献数字化工作;1999年第二年度“数位博物馆计划”将范围再次扩充;2000年“中央研究院”受台湾政府委托,全面规划“数位典藏计划”,为这项工作是中长期规划制定一个路线图。规划分为典藏、流通、研究、教学四个方面。其中典藏与流通以保存和传承典籍为目的,研究和教学则致力于服务当今社会。其中一个重要目标就是如何设计出符合文史学界使用,使古籍数字化资料成为文史学界教学与研究的工具,以提升研究效能和教学效果。如在这个目标规定下完成的大型的中文古籍数据库,可以提供一亿八千万字的古籍资料计算机检索服务,为文史学界的教学和研究提供了极大便利。

  在制定一个全国性的典籍数字化长远目标和总体规划时,首先应该考虑海内外珍本、孤本典籍的抢救,首先做好这类典籍的整理和数字化;

  高龄专家研究领域要优先考虑,使他们的业务专长乃至绝学不至随他们而去,如傅璇琮、孙钦善、王季思、周勋初、董治安等文史专家皆八十以上高龄,他们或在宋史、或在汉代典籍、或在唐诗、或在元曲等皆有绝活并取得骄人成就,应该配助手抓紧将他们研究领域的典籍和研究成果整理出来,用数字化保存下来。

  数字化产品的公益性和学术性亦需优先考虑。其中一些研究性的学术成果,是为专家学者提供服务;更多的则应是普及读物,是为普及国学知识、以普通读者尤其是中小学生为主要服务对象,要尽量实现典籍数字化的免费检索,并提高其学术含量。政府的资金投入和社会捐助,则是典籍整理过程的学术性和完成后的非营利性的最大保证。台湾中央研究院开发的《汉籍全文资料库》,其中就有一类是“人文资料库师生版”,就是为普及文史教育而向大、中、小学师生免费开放的。中国历代重要的文史典籍几乎尽数包括其中,约七千万字,约占整个《汉籍全文资料库》文献数的一半。这可以作为借鉴和参考。

  在实现这个全国性的典籍数字化长远目标和总体规划时,设定级别、层次,分清轻重缓急,由这个全国性的权威机构组织实施或进行协调,至少有以下几点需要抓紧进行:

  第一,将开发和研究团队根据人力、财力和研究开发优势分为不同层次,确定不同的研究开发对象。这个权威机构可以自己出面组织国家一级的团队,或像台湾由中央研究院出面那样,以中国科学院、中国社会科学院或著名高校为主组成研究核心,去完成一些重大项目和主干工程,如《敦煌学知识库》、《两汉全书》、《古今图书集成》、《新疆历史文献》、《新疆历史文献》、《西北疆域民族地理历史资料汇编》、《西北疆域民族地理历史资料汇编》、《中国海疆历史地图史料汇编》等历史文献图籍,以及《文苑英华》、《太平御览》、《册府元龟》等大型类书等数字化整理和研究;一些重点高校则可以发挥自己的研究特长、历史传统和现有成果,如中国人民大学的清史研究,北京大学的全宋诗,四川大学的全宋文,南京师大的全宋词,武汉大学的全唐五代词,陕西师大的隋唐史,北京师大的先秦史等。首都师范大学电子文献研究所历时八年完成的《中国历代基本典籍库》(包括《隋唐五代卷》、《先秦两汉魏晋南北朝卷》、《宋辽夏金元卷》和《明清卷》)以及大型古籍全文检索数据库《国学宝典》的完成应该说是一个成功的典范。

  第二,是为当今社会变革提供急需的历史借鉴。参与现实文化创造、体现当代人文关怀。在当今社会,一个学科的生命力往往取决于现实生活的需求,因为生活之树常青,而理论往往是灰色的。一个现代意义上的人文学科的确立,一个很重要的参照系就是能否为当代社会提供其它学科无法提供或不能有效提供的文化功能和人文关怀,能否参与当代的文化创造,否则,它就会缺少生命力,就会被其它学科所侵吞,或被在现实生活中更有活力的相近学科所取代。古籍数字化也是如此,那些为当今社会变革、民族复兴以及国家内政外交所急需的一些典籍,应该发挥数字化容量大、传播迅速、读者面广的优势首先加以考虑。1957年至1962年前后,中国史学会以及一些单位从当时的国家内政和外交需要出发,编辑出版了一批书目索引和题解,如中国史学会主编的《洋务运动书目解题》(上海人民出版社1961年版)、《中法战争书目解题》(上海人民出版社1957年版)、《中日战争资料书目解题》(上海人民出版社1957年版)、《戊戌变法书目解题》(上海人民出版社1961年版)、《义和团书目解题》(上海人民出版社1957年版),福建省图书馆编印《台湾、琉球资料联合目录》(1972年)、《我国南海诸岛资料联合目录》(1973年),福建师范大学1974年编印《东西南沙群岛目录及重要资料选辑》,中央民族学院研究室1973年编印《东北地区民族历史地理文献目录》,中国科学院民族研究所等1962年编印《新疆研究参考书目(中文之部)》、1959年编印的《有关西藏的图书目录》,云南大学1957年印《云南民族史史料目录解题》。当时由于纸质书籍的容量有限,只能编出这些书籍的目录或提要,在数字化的今天完全可以用电子网络解决原著的容量问题,而这些都是当今社会变革或我国内政外交所急需的典籍或资料。高校、中央和地方研究院所和民营公司可以选择一种或几种,集中人力物力,进行数字化研究开发。
  
  第三,一些尚未进入主流视野、尚未引起足够重视,也未进行系统整理,但确有实用价值和宽广发展前途的一些史料,如地方志,官修、私修史乘中“胡夷志传”;“佛老传”中高僧、名道、名刹、名观;州治档案刑名钱粮;家谱、族谱;与重大历史事件、时代转捩点有关的日记、杂记,如李慈铭、曾国藩、胡适之日记等;一些近来出土的如湖南益阳湖南益阳兔子山遗址、四川广汉三星堆、湖北随州周代墓葬中的碑刻、简牍、壁画、墓葬品等文物专辑、汇编等。由于电子产品的高科技、容量大、快速、便捷、成本低又便于传播携带等种种优势,皆是纸质印刷品所难以完成和无法取代的。

  第四,利用现有典籍和数字化的独特优势开发特色项目。如为阅读尤其是研究提供某种资料使用上的便利的“引得”。这种图书类型,上个世纪三十年代燕京大学曾经做过纸质产品,该校专门设立一个“引得编纂处”,从1933年到1948年十五年间编辑出版了48种“引得”。有的“引得”对象是专书,如《周礼引得》、《周易引得》、《论语引得》、《孟子引得》、《水经注引得》、《杜诗引得》、《毛诗引得》等;有的是史籍中某个专项内容,如《艺文志二十种综合引得》、《食货志十五种综合引得》、《新唐书宰相世系表引得》、《太平广记篇目及引书引得》;有的是典籍研究资料,如《文选注引书引得》、《汉书及补注综合引得》、《春秋经传引得》、《史记及注释综合引得》、《增校清朝进士题名碑录附引得》、《清代书画家字号引得》;有的是某类典籍的综合汇编类,如《辽金元传记三十种综合引得》、《八十九种明代传记综合引得》、《三十三种清代传记综合引得》、《四十七种宋代传记综合引得》等;有的则是典籍研究著作的“引得”,如《考古质疑引得》、《诸史然疑校订附引得》、《藏书纪事诗引得》等。这些门类众多的引得为阅读和研究提供了极大地便利,如1933年出版《艺文志二十种综合引得》,将十五种艺文志和五部禁毁书目所收先秦至清末四万余种图书按书名和作者编成综合索引,并附笔划检字,甚便检查;1937年出版的《礼记引得》,以上海锦章书局1926年影印江西南昌府学本《十三经注疏》的文字为准,凡名词及较重要的动词、形容词皆列为目,下引含有该目的句子,句后标明篇、节。各目按中国字庋撷编排,附笔划和拼音检字,查考便利。又附《礼记篇次、节数表》和《开明版礼记节数与他版礼记页数互推法》,以便查找其他版本。但由于战乱和解放前夕这所美英基督教会大学的关闭,造成典籍编纂的中断。1960年,中华书局曾影印了其中的几种,现在的古籍数字化可以利用自己的高科技优势将其数字化,也可以开辟另一些典籍或典籍研究类著作的引得。
  
  发挥典籍数字化的高科技优势,其手段当然不只是以上几种,譬如我们还可以利用计算机对某些历史场景进行模拟,通过虚拟复原使研究得到比较直观的参考。例如浙江大学计算机科学系与敦煌研究院合作,模仿海外的《古埃及虚拟旅行大百科》(Egypt Antique 3D 2004 DVD),制作的“敦煌石窟虚拟重现与壁画修复模拟”研究,除了利用虚拟现实技术实现了敦煌石窟虚拟展示,使人徜徉于古代敦煌种种佛教场景之中,还利用壁画复原与演变模拟系统完成了壁画图像色彩的数字化复原与历史演变过程的模拟。宋代张择端的《清明上河图》在世博园中也完成了电子复制模拟和再创造。《史记》、《汉书》等史志的本纪、列传,佛老传、高僧传中的人物故事,唐诗、宋词、元曲、明清传奇的诗意和情节也都可以照此办理,应当说典籍数字化的领域是相当广阔的,只是需要我们更新思路、开拓视野。

  二、统一标准,整体调控

  在古籍数字化总体目标和规划设定后,如何制定一个国家统一标准和由国家权威机构进行统筹协调则至关重要。

  规范、统一的数据库形式是数据库的生命所在。古籍资源数字化一旦进入大规模实施阶段,必须依托于一系列兼容、通用的计算机处理软件。如果没有规范的机读目录格式,数据库就无法进行交换,无法真正实现国家乃至世界范围内的资源共享。目前很多单位都在做古籍书目数据库或古文献资料数据库,并自造了相当数量的字库,但这些数字化古籍其处理软件基本上还是各自封闭的,由于古籍资源数字化处理软件的通用程度低,导致的结果是重复研制开发屡见不鲜,不仅延缓了古籍资源数字化的进程,还造成了有限资源的极大浪费。由于建库的标准各不相同,在技术上很难与其他数据库融为一体,造成知识体系的割裂。也由于书目数据不准确,造成不同的书被著录成一种书,或者是一种书被著录为多种书的状况,给读者的使用和研究带来极大不便。有的开发单位出于知识产权和商业利益的考虑,故意不采用通行的行业标准,自行设定相关的数字化加工与组织标准,给数据共享人为地设置了很多障碍。致使一些数据库涵盖的文献资料颇为有限,远未能实现对全国范围内的整体检索,古籍数字化成果的利用受到很大限制。因此,开发研制网络环境下古籍整理通用软件系统,建立一个规范、统一的数据库,实在是古籍数字化进程中的当务之急。

  目前,如此现状已引起国家相关部门的重视:2007年,国务院办公厅下发《关于进一步加强古籍保护工作的意见》,其中明确要求制定古籍数字化标准,规范古籍数字化工作,建立古籍数字资源库。2011年,文化部发布《关于进一步加强古籍保护工作的通知》,要求加快古籍的数字化建设;2012年5月22日,由文化部主办,国家图书馆、国家古籍保护中心承办的“全国古籍数字化建设与服务工作研讨会”在北京召开,国家图书馆相关负责人和各省、自治区、直辖市省级图书馆馆长及有关专家出席研讨会,就全国古籍数字化合作服务机制、国内外古籍数字化保护利用、古籍数字化成果共享方式和古籍数字化标准规范等问题进行了充分讨论。但所有这些,只是给古籍数字化和资源共享带来希望和曙光,还需要一个国家级的更权威、联系更广泛、也更专门化的古籍电子产品和网络管理机构去贯彻、去落实。因为要想建立一个完整的中国古籍数据库,并保证数据库的质量和查询服务效果,首先就必须统一建库标准和规范:要有规范的著录条例、数据库格式、编目软件使用字库,还要有统一的古籍分类法,这些标准的制定不仅要由图书情报界、信息产业界和与标准相关的软件开发商参与,而且也要有从事古籍整理的专业人员参与,只有这样才能为读者提供一个共享古籍文献的统一平台。因此必须有一个上述机构出面,指导从事古籍数字化的主要单位,在全行业进行计算机古籍整理通用系统的研制开发,制定统一的数据格式要求,实现标准化、规范化,在此基础上进行分工合作。对古籍原本进行鉴别和统一著录,执行统一的分类表和分类原则,建立可共享互惠的资源体系。

  台湾的古籍数字化在地方政府重视下,目前已逐渐成为有计划、有标准的规范性操作。在资料整合方面,为了方便不同资料库之间资料的交换、流通,建立了对设资料的标准格式,并进一步发展为后设资料与XML技术相结合,以提高资料检索的完整性和精确性,可作为我们制定统一标准的参考。

  古籍数字化在制定统一标准的同时,还需整体调控和统筹协调。我国古籍数量庞大,且往往分散各地,仅由一个单位或组织来负责完成某一专业领域内的古籍书目数据库建设是非常困难的,需要多方合作才能进行。古籍数字化建设必需动员各方面力量,群策群力,相互协调,相互配合,这就需要上述的权威机构来门来整体调控和统筹协调,不然就会导致重复开发和资源浪费。无庸讳言,在今天的各种数字化产品中,内容的大量重复是一个严重的问题。开发单位各自为政,多以商业利益为核心,带有浓厚的商业色彩,片面追求规模与宣传效应,致使古籍的数字化集中于“少数”常用特别是丛书类的古籍,大家一拥而上、重复建设,而大多数学术界需要的古籍的数字化无人顾及。例如文渊阁《四库全书》纸质版发行后,1998年以来先后已有多家进行过影像数字化,继上海人民出版社、北京书同文公司与香港迪志文化出版有限公司的电子版后,陆续有武汉大学出版社的光盘版、“中美百万册书数字图书馆”的网络版等。还有一些机构曾经也进行过相同的工作,只是由于各种原因最后没能面世。至于像《二十五史》这类规模稍小但更常用的文献,其数字版本就更多,几乎现在称得上数字化项目的产品都全部或部分包含了它们。这种重复在人力和财力上都是一种浪费,它提高了开发成本,同时相应减少了对其他可开发项目的投入。同时,由于基础工作和专业人员准备不足,使这些电子产品也存在许多质量问题。从整体上也使古籍数字化的进程因为“程序错乱”显得有点“步履蹒跚”。

  所以,我国古籍数字化建设应在权威机构主持下,协调好各个开发单位的工作,鼓励合作开发,共建共享。最近,港台地区古籍数字化系统出于商业利益或其他考虑,为了方便大陆读者和研究者,逐渐使用大陆出版的古籍点校本,将自身的数字化技术优势和经验与大陆的资源优势和古籍整理人才优势结合起来。如香港迪志公司与北京书同文公司、上海人民出版社共同研发的《文渊阁四库全书》电子版,就是一个成功的范例。

  在具体实施上,应分清轻重缓急,在权威机构主持下,根据规划有步骤分阶段有条不紊的进行。首先应该进一步完善古籍书目数据库,有了古籍书目数据库,不仅简化了古籍的检索方法,增多了检索途径,而且可以极大地方便读者,提高服务效率;其次是大规模总结性古籍检索工具的数字化,总结性的、权威性较高的古籍工具书,如《辞源》、《中国丛书综录》、《中国古籍善本书目》、《中国版刻图录》、《中国地方志联合目录》、《中国地方志总目提要》、《中国历史地图集》、《中医图书联合目录》等,这些工具书本身或许并不能称为古籍,但却是人们充分地利用古籍资源、打开古籍资源宝库的有效的参考工具和引导工具,是实现古籍真正数字化的基础。再次是计算机古籍整理通用系统软件的研制。开发古籍资源数字化一旦进入大规模实施阶段,必须依托于一系列开放、兼容、通用的计算机处理软件,如OCR软件、校对软件、标引软件、检索软件、研究支持软件等。

  三、创新思维与时俱进、修订和制定相关法律法规

  古籍数字化是一个浩大的工程体系,其读者与生产者、生产者之间、电子产品与纸质产品、古籍与数字化古籍之间涉及的问题很多,而且还会不断会产生新的问题,如古籍的“文献保真”和“文献整理”的界定和处理原则;典籍的电子产品与典籍本身的关系;典籍版本的选择以及所涉及的典籍持有者与电子产品生产者之间关系;典籍已有的纸质产品和电子产品之间著作权的界定;如何体现数字化过程中古代典籍在知识产权保护中的特殊性等等。这些问题都是典籍数字化过程中发生的新问题,都无成规可循,必须通过制定相关法规加以解决。制定相关法规时我以为应该有两个基本原则或前提:第一,要认识到古籍数字化是一个新生事物,他给人们的阅读方式、研究手段乃至思维方式都带来重大的甚至是革命性的变化,计算机强大的储存空间和自动检索功能,将彻底改变人脑记忆的限度,这必将使人脑解放出来用于更多的抽象思维活动。这对振兴中华、实现文化复兴乃至实现强国梦,自有其不可取代的价值。因此法规的制定,应从爱护和扶植出发,有利于其生存发展,成长壮大;也必须有利于对其规范、调控和统筹协调,使其能健康地、沿着正确的轨道前行。第二,必须创新思维与时俱进,对于数字化过程中的上述问题及时研究、及时解决,而且能有前瞻性,不应该拿过去的纸质出版物的相关法律法规照搬照套,这样才能典籍数字化这个新生事物起到保护和扶植作用。如国学时代公司(即国学网)与中华书局围绕诉“中华书局点校本《二十四史》、《清史稿》”的电子产品侵权案就是一个典型的案例。诉讼方中华书局告国学网电子产品《二十四史》、《清史稿》侵权。理由是这两部书是在古籍作品的基础上经过中华书局创造性劳动而派生出来的作品,是演绎作品。我国著作权法规定:两部古籍的整理本在分段、标点、校勘中,相似度超过50%以上就基本可认定为实质性近似,因此可认定国学网电子产品《二十四史》、《清史稿》侵权。被诉方国学时代公司则认为古籍的点校相似是古籍整理必然现象,点校作品之间不会有较大差异。古籍本身和加注过标点的文字,其技术处理仍是文献本身,并不形成独立的表达,不存在著作权。如果有著作权也只应在“校记”中,但“校记”只是在带有考辨性质并有自己观点时才有著作权,如果仅仅是列举,同样不能享有著作权。如果对加注了标点这种“标点”给予著作权保护,势必会形成一种不合理的垄断,阻扰和延缓古籍数字化的进程。但结果是国学网败诉:2012年8月31日受理法院北京海淀区法院一方面认定“本案中,中华本与国学本在内容上都属于对二十四史和《清史稿》进行点校的版本”,“本案中,上诉人(指中华书局)认可国学版并非对中华版点校本的直接复制”;但又判定国学本“二十四史”在未经授权的情况下复制、发行了中华本“二十四史”,判国学停止使用,赔偿2万。其理由是“本院认定中华书局公司在本案中主张的以分段、加注标点和文字修订的方式完成的‘二十五史’点校作品具有独创性,其点校作品应当受到《著作权法》的保护。”此案的判决一出,引起古籍整理界、法学界和国学用户的广泛关注,相关消息屡屡见诸媒体。被诉方自然不服上诉,正在走法律程序,结果尚未可知。导致这样的判定原因可能很复杂,也许就像被诉方所声明的那样,这不是“简单的知识产权之争,而是新兴产业和传统产业的文化资源之争,垄断和反垄断之争,国企和民企之争”(尹小林《世纪知识产权第一案的是与非——古籍〈二十四史〉知识产权案七问》,见《国学网》2012.10.9)。但如何正确认识和处理古籍、古籍整理纸质产品与古籍整理数字化产品与三者之间的关系则是关键所在。从这个角度说,导致这场诉讼的原因主要有两个:一个是古籍数字化与高科技紧密相连的一条通往未来之路,其中蕴藏着无限生机,自然也蕴藏着巨大商机;二是有关古籍数字化出版物的法律法规滞后,也由于缺乏上述的一个国家级的更权威、联系更广泛、也更专门化的古籍电子产品和网络管理机构去进行政策性指导和协调调控,结果双方矛盾越演越烈,直至对簿公堂。从前者来说,一些热门的古籍如唐诗、宋词、史记、汉书、李太白集、杜工部集,各家出版社皆蜂拥而上,出版的各种纸质出版物不啻百十种,由于皆以古籍为本,其间的“分段、标点、校勘中,相似度”多远远超过《著作法》规定的50%以上,但似未见哪家出版社为李白、杜甫文集的版权产生争论,更未见过法院的相关判定。就以中华书局与国学网的《二十四史》侵权之争来说,1996年,由海南国际新闻出版中心出版过《二十四史》的简体字点校本,远早于中华书局2000年发行的简体本“二十四史”,其间的“分段、标点、校勘”相似度并不少于50%,但并未偶见双方由此引起诉讼。至于诉讼方曾提到的国学网电子产品《中国历代笔记》,这类纸质产品更多,我说见到过的就有古小说丛刊(12种)(中华书局1979)、《四库笔记小说丛书》五册(上海古籍出版社1992)、《中国笔记小说文库》计八种(上海文艺出版社1990)、《笔记小说大观》,(江苏广陵古籍刊行社)、《中国文言小说百部经典》(北京出版社2000年)、《笔记小说精品丛书》(重庆出版社2005)、中国小说史料丛书(人民文学出版社1983)、《历代笔记小说丛书》(文化艺术出版社1988年)、《历代笔记小说丛书》(齐鲁书社),这还不包括一些断代的笔记小说丛书,如台北:天一出版社《明清善本小说丛刊初编》,大象出版社《宋代笔记》、鲁迅《古小说钩沉》、汪辟疆校录《唐人小说》、张友鹤《唐宋传奇集》,也未见因“分段、标点、校勘”相似度相近而产生纷争和诉讼。再说,“千家注杜、百家注韩”也是我们民族的文化传统,就是标点断句,也是古已有之,只是不同于汪原放以后的新式标点,称为“句读”而已,韩愈就曾将标点句读视为古文知识中的小道,说过“句读之不知,惑之不解,或师焉,或不焉,小学而大遗,吾未见其明也”。因此上述争论的产生原因很容易使人联想起电子产品容量巨大、携带方便、价格低廉、便于使用和传播等高科技带来的优势!

  至于后一个原因,国学网的创始人尹小林上述的文章《世纪知识产权第一案的是与非——古籍〈二十四史〉知识产权案七问》中曾坦承自己“曾是中华书局的作者,和书局的几位领导都是好友,诉讼过程中许多人曾出面劝两家和解,为什么不能和解呢?苦苦思索后,终于悟出点道理:我们各自肩负的责任太大,不能轻言放弃”。这当然是个理由,因为或许如文章中所指出的:该案的最终判决很有可能直接影响古籍数字化的发展走向。但有关古籍数字化政策法规的滞后应该是更直接的原因。因为具体到《二十四史》、《清史稿》这类电子产品,从技术层面上来说,只是对古籍《二十四史》、《清史稿》进行数字化处理,包括分段和标点,主要用于检索统计,不是对《二十四史》、《清史稿》进行校勘研究,本质上只是原文展示,并不涉及著作权;由于没有做全面校勘工作,因此也不存在对古籍整理研究类纸质产品的侵权。关于这些方面,应该有新的专门针对古籍数字化电子产品的司法解释。其实,上述的侵权理由是依据1991年《著作权法实施条例》第五条对“整理”的解释:“指对内容零散、层次不清的已有文字作品或者材料进行条理化、系统化的加工,如古籍的校点、补遗等”,该条在2002年修改后的《著作权法实施条例》中已被完整地删除,现在再以此依据来判定新作品尤其是电子产品侵权显然是不正确的。

  另外,如果有一个国家级的更权威、联系更广泛、也更专门化的古籍电子产品和网络管理机构,进行政策性指导和协调、调控,也可以避免或减少上述矛盾的发生。因为文献、文献的纸质整理和数字化加工,三者应该是共存共通的。古籍数字化应该与纸质图书在统一标准规范的框架下进行细化,通过协调机制或某种法律法规形式达成共享协议,使所有的资源能够在同一平台上使用并互相调用,这样不但是纸质出版物和电子出版物之间做到互利互惠,而且不仅节省加工成本,又方便用户的使用,可谓一举三得。

  四、培养兼跨古籍和计算机两专业的古籍数字化专门人才

  古籍资源数字化是传统学术方法与现代科学技术的结合。古籍数字化过程中,版本选择、文字校勘、文献辨伪和考证是其前提和基本功,从事古籍数字化工作的人员也必须要有古典文献学的基本知识。因此,它需要一批既有古汉语、古代文史知识、懂得古籍整理又精通计算机技术的人才。而目前的现状却是古籍整理专业人员不懂电子技术,计算机技术人员缺少古籍知识。大学是培养古籍数字化专业人员的主要基地,但目前的培养模式却是割裂的:图书馆系开设的专业是文献学、目录学、信息学、传播学、管理学、经济学。现在也要求掌握文献信息搜集、处理、研究、开发与传递的技能,但却没有计算机软件与理论、计算机应用技术的专门课程;计算机系倒是开设的专业计算机应用技术、信息管理等专业,但又缺少文献学、古代汉语、中国通史、中国文学史等古籍数字化必备的课程和专业,就是文史积淀较厚的清华大学,其计算机系也只有计算机系统结构、计算机软件与理论、计算机应用技术三个二级学科。目前部分院校的信息管理学专业虽已开设了古籍数字化课程,但这些课程都不是针对古籍整理专业的学生而开设,而是面向人文学科学生的信息基础素质教育,主要是为了指导学生了解并能够检索和利用古籍中的文献信息。培养兼跨古籍和计算机两专业的古籍数字化专门人才应是当务之急,它关涉当前古籍数字化的进度、质量,更关涉他的前途与未来!

  另外于古籍数字化的早期阶段,技术问题是古籍数字化关注的焦点和问题集中所在,形成了目前活跃在古籍数字化研究中的专家,绝大多数属于图书馆界和信息管理界,而真正从事古籍整理的文史专家则很少参与,甚至有的专家还以不会网络,只用笔书写而孤芳自赏。技术实践进展迅速,理论研究相对滞后,尤其是系统理论研究和指导的缺乏,是目前古籍数字化领域的一大弊端。古籍数字化并不是数字化古籍,决不是单纯的计算机技术工程。他是古籍领域的一场革命,涉及到使用者、制作者和管理者诸多方面的一场颠覆性变化。

  对使用者来说,计算机网络只是一个平台,他所提供的一切资料都是机械的、死板的,最终还要靠人脑来判断、分析和升华。数据资料能否发挥功效和发挥多大功效,要是人的学养和智慧而定,而这种学养和智慧则是以国学学基本功的学习和训练为基础的。计算机和网络的超链接功能,会使我们的线性阅读方式和阅读习惯发生改变;也会由于使用搜索引擎寻找一切资料的快速便捷,会使我们失去掌握、分析、消化、运用典籍、资料的能力,从而使我们的论著失去思想、独立见解、创新能力甚至个人风格,变成资料的搬运工和建筑工,计算机和网络的超链接功能,“剪切”、“粘贴”、“复制”的方便容易,也更方便、更容易使一些学者堕落成为“剽窃者”和文章“裁缝”。急功近利、浮切躁进、剽窃冒功、因人成事却居功不韪这些社会病同样存在于在古籍数字化的进程之中甚至蔓延泛滥着,这都是古籍数字化这三十年来不争的事实。

  对生产者来说“古籍数字化”也并非是简单地“数字化古籍”制造者。不仅需要技术的不断改进和创新,更需要演进历程的重新审视和反思。从古籍数字化对象的选择,到与古籍内容相关的参考资料和辅助工具的选定和制作,到国学知识的编写、普及的举措,从来都不是一个简单的“技术活”,他需要眼光、需要胸怀,需要一种悲悯情怀和献身精神,从根本上来说就是参与现实文化创造,体现当代人文情怀。一个现代意义上的古代典籍数据化学术中心的确立,一个很重要的参照系就是能否为当代社会提供其它网站或资料库所无法提供或不能有效提供的文化功能和人文关怀,能否参与当代的文化创造,否则,它就会缺少生命力,就会被其它学科所侵吞,或被在现实生活中更有活力的相近类别所取代。道理很简单,因为“生命之树常青,而理论往往是灰色的”。所有这些,都需要对古籍数字化进行理论思考和探讨。这种思考与探讨不仅要有技术层面的研究和设计,更要有人文精神的渗入和前瞻性研究,这都需要在计算机技术尤其在古代文史方面有深厚的学养,有专业能力,更有人文精神,去研究现实问题,其开拓创新未来,这才会使古籍数字化这项事业具有无限的生命力和无限宽广的未来。

  台湾在古籍数字化初期,在主要依靠信息技术人才的同时,也有超前意识。他们以“研究助理”形式开始培养懂得古籍的专门人才以协助数位化进程。1998年,全台“数位博物馆专案先导计划”启动后,台湾分北、中、南、东四片开设一系列“数位博物馆素养培训班”,台北大学更是设立专门专业,培养兼跨古籍和计算机两专业的古籍数字化专门人才。这方面经验亦可供参考。

  (本文是在2013年8月15日“第四届中国古籍数字化国际学术研讨会”上的发言)

(作者单位:安徽省社会科学院)

  

Comments are closed.