中国社会科学院杨成凯研究员关于参与建设《国学宝典》的证明信
一
从一九九九年至今,我一直在使用《国学宝典》古籍数据库,并参与了古籍版本选择、句读、校勘和审定等工作。《国学宝典》包括十三经、二十四史、清史稿、历代笔记、小说、戏曲、唐诗、宋词等。经过十多年的建设,目前,《国学宝典》收书总数已达6000多种,总字数达15亿字,数据均为全文新式标点。特此证明。
二
我和尹小林先生相熟,和刚才几位先生说的一样,也是从《国学宝典》开始的。从《国学宝典》一开始的时候,数据量还不是太大,到今天已达到四五亿的规模。我觉得尹小林先生的工作非常认真,而且非常执著。我们知道做数据库的,往往是一开始做了一些以后,因为种种原因,遇到种种困难,或者不挣钱,或者出现什么问题,以后就不再做下去了。但是尹小林先生不同,他是持继不断的做下去。说实话,我从一开始接触《国学宝典》,没想到它能发展到今天。而且也没有想到它能够放到WINDOWS界面里面,有这么多的功能。这是我想不到的。而且他对用户认真负责的精神也使我感动。这些都是一个很好的品质,也是他成功的一个直接因素。
尹小林先生在前不久跟我说起过“电子文献学”的构想,我想他这个想法也是相当先进的,为什么呢?因为我们知道,每一个领域只要出现一个新的工具,它都会造成一种革命性的变化。我们知道工业革命跟蒸汽机的发明有关系,电脑发明以后,我们许多领域都有了一些新的变化,过去做不到的事情现在可以做到了,自动控制方面做到了许多事情。电脑在学术研究方面,可以想到它也会给我们带来一些革命性的变化,刚才各位先生都说到了。通过字词的检索,使用频率的检索,可以观察一个社会风气、思想的一些状况。像这样一件有用的工具,肯定能够在我们的学术研究中造成深远的影响。随便举个例子,过去做学术研究工作依靠什么呢?大师们依靠自己的腹笥,肚子大,里头装的书多。我们知道,在浩瀚的中国古代典籍当中,无论我们的肚子有多大,我们也只能满腹而已。随便举个例子,像江白石的《齐天乐》起调是“庾郎先自吟愁赋,凄凄更闻私语。”夏承焘先生的《姜白石词编年笺校》说:“今本庾子山集无愁赋,前人谓白石此句杜撰。案王若虚……似宋金人所见庾集实有愁赋。”后钱钟书先生告知《海录碎事》卷九下曾引《愁赋》,而且宋人多有引用。饶宗颐先生的《词籍考》指出吴兆宜注《庾子山集》已收此赋。现在想来可能很少有人看吴的注本,也可能吴兆宜的注本在开始初印的时候,还没有“愁赋”的断句。很可能是后来补充进去的,因为吴的注本在它的刻印的进程中,有明显的证据,说明它初印跟后印是不一样的,后印加了些东西。我们若用数据库检索,不难发现宋元人诗文多处说到庾信的《愁赋》。《海录碎事》、《记纂渊海》、《韵府群玉》,甚至《渊鉴类函》都有引文,吴兆宜注《庾开府集笺注》卷一即引自《海录碎事》。像这个例子,我们如果使用电子检索工具的话,很快就能查得出来。可以查出文献里头,好多地方都提到了“愁赋”的断句。这个例子能说明什么呢?说明即使是大师,即使是我们专业工作者,也不可能记诵渊博到无所不知的地步。我们现在有这种电子检索工具,有电子数据库,它很可能对我们的学术研究带来革命性的变化。像曹先生刚才说的,在辞书编纂方面,显然是会给我们很大帮助的。我们甚至可以预测,《汉语大词典》有了大型数据库以后,很可能里面的书证大批的都被换掉。而且也有可能编一个像《英语大词典》那样的《汉语大词典》,历史原则,追踪一个词从开始到现在,它的词义有哪些变化,在不同的时期,它的用法有什么变化。这些仅仅靠我们人的力量,仅仅靠脑子的记忆恐怕是做不到的。因为我们的文献太浩瀚了,但是有了这样的数据库我们就能做这样的工作。
另外我想到的一点就是,像《国学备览》,这里头仅仅选了81种书,但是功能设计的是非常完善的。它除了给我们提供了一批最基本的国学读物以外,在向社会普及方面起作用,它还有一个很大的作用,就是使社会上更多的人体会到电子数据库的作用,它会做到什么事情。它会使电子文献在社会的普及方面起到很大作用。因为它售价很低,我们知道《四库全书》的光盘是8万元呢。我们很难想像个人去买一套《四库全书》。《四部丛刊》全文检索版也是一万六呀,这也是很高的。很难想象,如果我们接触不到的话,我们就很难想到这些个数据库对我们有些什么用处,象《国学备览》就能起到这个做用。它只售28元,人人都可以买一份回家去,体会其中的好多好处,对古籍文献的普及方面起到很大作用。另外它的设计当中,我非常欣赏的是它有多条件的逻辑“与”、逻辑“和”,这些概念非常好,我们知道,现在做机械性匹配检索,查哪里有这个字、词,或哪里有这句话,这是电脑最容易做到的事情。但是主题检索就比较难了,我们要查一个成语出现在什么地方,很可能它的原始出处,不是今天我们常用的那四个字,如果我们把那四个字打进去的话,很可能找不到它的原始出处,多条件组合检索,就可以起到这个作用,它可以把这四个字拆开,要求在同一段里出现两个字、三个字或四个字,可以不连续地出现,这个功能我非常欣赏,实现这一功能,需要对文本做标点和分段的工作,这是《国学宝典》我非常欣赏的一点,因为现在《四库全书》和《四部丛刊》都做不到这一点。因此多条件的检索,在《四库全书》和《四部丛刊》目前讲都是没有意义的,因为他的《国学宝典》是分了段的,我们可以要求这几个字出现同一个段里,可以出现在同一小句里,这个作用就非常大了。我觉得这个工作做得非常有意义的,而且许多想法,许多观念都是相当先进的。
首师大给我留下深刻印象的第一件事,就是他们建立了一个语言研究中心,而且他们语言研究中心进行了语言哲学的研究,使我感到思想和观念非常先进。这次使我领教的是,在电子文献方面他们又走在了前面,给学术界提供了很多有用的工具,也造福于学者。我今天就讲这些,谢谢。
摘自2003年7月8日《国学备览》光盘出版发行座谈会讲话