www.guoxue.com
公元二零零四年五月三十日
古籍整理留言薄


 

繁体字输入是创建汉文史资料库
的基本学术要求


许逸民

2004年

第七期(总401期)

第八期(总402期)

第十期
第十期
第十一期
第十二期

 

  为了能够形象地说明问题,在切入主题之前,不妨让我先说一件事作为例证。多年前,我耗费不少精力点校了清人钱谦益的《列朝诗集》,1996年稿子被《传世藏书》采用,作为其中的 第18、19分册出版。从外观上看,这是一个装帧很豪华的本子。不久前还承尹小林先生见告 ,他们依据此本把《列朝诗集》输入了《国学宝典》。听说直接用《传世藏书》本制作数据 ,我真有些感到意外。因为当初拿到《传世藏书》的样书,我便大失所望,根本无法认同它的排版体例。问题主要出在两个方面:一是它彻底破坏了所据底本的行款,版面16开,分为左右两栏,诗篇按两句一行,分行排列,形同当代诗歌,致使同一诗题的多首诗之间几乎无 以区别;二是全书改用简体字横排,滥用简化字同音替代、部首简化的原则,完全抹杀了古 汉语一字一义、音同字不同的语言特点。这两个问题所造成的严重后果,就是原有的版本价 值(行款、文字)丢失殆尽。我们从《传世藏书》本《列朝诗集》,别说已难找回清顺治九年 (1652)毛氏汲古阁刻本的原貌,甚至连宣统二年(1910)神州国光社重排铅印本的面目也模糊不清了。

  我当然不反对今天的古籍整理图书改为简体横排,尤其是选注、译评之类的普及读物,简体 横排可能更适合广大读者的阅读习惯。但我认为,古籍整理图书的出版要分清读者对象,分 出档次,繁体、简体各取其宜。凡属重在传承的基本古籍,如《二十四史》、《十三经》、 先秦诸子及类书、总集、别集、考订笔记之类,最好还是用繁体直排。这样做一则比较接近 古籍的惯有风格,二则可以避免文字上繁简转换而产生的混乱。总之一句话,繁体直排可以 较好地保持所采用底本的版本价值。毋庸讳言,如果简化字在古籍整理领域的运用不加节制 ,势必会给我们的文史研究带来许多不必要的麻烦。谓予不信,请看《传世藏书》本《列朝 诗集》中的下列几组诗句:

  (1)“容易岁云除”(页74。为省篇幅,不注作者、篇名,只注页码);“新知固云集”(页85 )。据《新华字典》,简体“云”字有三义,此处二字同义,抑各有其义?查底本,知前者为 “云”,乃文言助词;后者为“云”,喻多人聚集。在繁体中,这两个字不 会混为一谈。

  (2)“余生若小草”(页461);“余欢与日移”(页815)。两个“余”字,一概解作自我指代 的“余”固无不可,一概解作“剩馀”的“馀”亦可通。在底本中实则前者为“余”,后者 为“馀”,两个字的意义相去不可谓不远。

  (3)“花发对谁言”(页1265);“安得发不变”(页86)。“花发”二字,照现在的字面讲就是花白的头发,于义可通,若恢复为繁体,也极易变成“華髮”,但实际上底本作“花發”。后一句“发不变”的“发”,底本作“髮”。

  (4)“引惹长条系愁绪”(页388);“由来治忽系出处”(页417)。今之简体“系”字,除“ 系统”、“系列”、“中文系”的用法外,还具有“干系”、“联结”二义。“干系”的 “系”,繁体作“係”;“联系”的“系”,繁体作“繫”。三个字的意义其 实各不相同。查底本,前一句作“係”,后一句作“繫”,均非“系统”、“系列”之“系”字。

  (5)“襄阳冠盖里”(页729);“鸣珂坊里将军第”(页273)。后一句“坊里”,若误解为居住地,则与前一句的“里”字无差别。而底本前者为“里”,指居住地;后者为“裏”,指里面。在繁体中,二字实难通用。

  (6)“鸳鸯只宿双生树”(页1541);“畏只映花行”(同前)。简体“只”字既作副词,又作 量词。事实上“只”字古已有之,繁体又写作“祑”、“祗”,仅作 副词使用,量词 必写作“隻”。底本此处前者当作“祗”,后 者当作“隻”。简体以“只”、“祗”互换尚可,以“只”为“隻”则嫌扞格。

  此外,如“玉树青笼回上苑”(页953)之“回”当作“廻”,“复径迷难出”(页1291 )之“ 复”当作“複”,“却向穷涂哭”(页409)之“涂”当作“塗”(此处即令简化亦当作“途”),“今日宫人斗来洗”(页359)之“斗”当作“鬥”,“长须携尺素” 之“须”当作“鬚”,“门前梦绝征书忧”之“征”当作“徵”,“ 风摇竹影书签乱”之“签”当作“籖”,等等,俯拾即是,不烦枚举。

  由此可证,古籍经过整理一旦改为简体横排,不惟其行款大别于原刻,而且其文字亦将歧义迭出,令人往往莫衷一是。若凭借这样的本子来奢谈古籍的版本价值,恐怕只能贻笑于方家 了。从这个事例回到本文要讲的主题,那么问题便一目了然。就是说,我们要创建的古籍数 据库,亦即汉文史资料库,如果用来输入的底本都像《传世藏书》本的《列朝诗集》那样, 则在文史研究者看来,资料库的可信据的程度、可利用的效率未免要大打折扣。其他姑不论 ,简单说从这样的资料库里取录资料,要想把它恢复成繁体,做到与原文没有出入,显然不 是件容易的事,恐怕核对原书的程序是不可免去的。仅此一点,对于那些想用繁体字本发表 论文的作者而言,用简体字创建的古籍数据库,其功用充其量只是一个提供出处的索引库而 已。

  如何最大限度地发挥古籍数据库的功用,我以为首要一点是保证其资料形态与原来的底本高 度一致,以奠定其可以信据的基础,然后才是尽量施展其无限包容、快速检索的特殊功能。 基于此点考虑,我一直强调创建古籍数据库必须坚持用繁体字输入,而且一般不改字,文字 尽可能与底本一致。按照这一原则创建的数据库,如果像《国学宝典》那样,是以经史子集 各种书的原本做数据,那么这样的数据库不仅具有极大的实用性,而且也有着极高的版本价 值。这个意见我曾在去年发表的一篇小文中提出过(见《古籍整理出版情况简报》2003年第1 1期),现在想再补充几句。

  众所周知,鉴别古籍的版本,要从形式和内容两方面进行考察,形式方面包括序跋、牌记、 行款、字体、讳字、刻工、藏书印记、后人题识等,内容方面包括卷数、卷端、编例、篇目 、文字、学术源流等,内容和形式共同构成了通常所说的版本价值。而古籍文本一旦输入资 料库,它在形式上原有的许多鲜明特点不可避免地会丢失,如牌记、行款、字体、讳字、刻 工、藏书印记之类,假若再将原本繁体字一并转为简体字,那就真不知此本与彼本将何以联 系,简体字尚能保存几何原本的版本价值了。可以说古籍原本输入电脑后,就其形式而言, 能够识别其为某个具体版本的标志,除了著述体例,主要在于文字,一字不易地留住原本的 繁体字,无疑是维护其固有版本价值的最有力的措施。

  说到保留古籍文本繁体字的重要性,还应读一读周培源先生的下面这段话:

  (竺可桢)把自然科学引入版本校勘学的领域。例如,他考证说 ,王之涣《凉州词》:“黄沙直上白云间,一片孤城万仞山。羌笛何须怨杨柳,春风不度玉 门关。”这是很合乎凉州以西玉门关一带春天情况的。玉门关是古代通往西域丝绸之路的必 经之地,唐代开元年间,写边塞诗的诗人,对于安西玉门关一带春天几乎每天日中都要刮起 黄沙、直冲云霄的情况是熟悉的。但后来不知在何时,王之涣《凉州词》第一句被改成“黄 河远上白云间”。到如今,书店流行的唐诗选本,统沿用改过的本子。实际上黄河和凉州及 玉门关谈不上有什么关系。竺可桢先生这番考证,比起一般的考证更进一步,更带有科学性 ,所以更有说服力。(《自学成才要有文史知识》,《文史知识》1982年第5期)

  这段话讲的是唐诗通行文本文字有误,科学家竺可桢在研究唐代的气候变迁时,以史证诗, 纠正了《凉州词》的传写之讹。应该说,通行本并非没有版本依据,世代相传,似乎也已约 定俗成。但竺可桢的科学研究成果可以证明,始作俑者确曾有意或无意改动过王之涣的文字 。这种文字错误给学术研究带来的烦恼显而易见,这虽说不是因为繁简字体转换而生,它却 可以作为一个反证,说明文字的改动可能会增加研究的成本。试想若《凉州词》不存在文字 错误,我们的科学家引用起来不是更直接、更理直气壮吗?何必枉费此等校勘功夫呢!由此也 引 起了我的杞人之忧,当我们把繁体径改为简体以后,难免不会在文字上给当代人增添无谓的 考辨烦恼,难免不会给后人埋下鲁鱼亥豕的无尽隐患。

  以上是说把古籍文本输入资料库时,须一字不易地使用繁体字,从而最大限度的保留原本的 版本价值,这是我想表达的第一层意思。第二层意思,我还想要指出,古籍文本的选择亦即 底本选择至关重要。现在所见资料库软件,在底本选择上既嫌粗率,输入时又往往只录正文 ,掐头去尾,竟将序跋、题识、批点等自行删弃。编纂者的这种态度,完全忽视了版本学的 常识,所录入的资料又如何能够取信于人?至于资料库对输入底本的选择,我主张凡经整理 过的古籍应尽量用整理本,甚至应该连同其校注内容一并输入。只有这样做,才有利于研究 者在前人已有成果的基础上继续提高,避免重走弯路。当然,这样做也面临着一道难题,因 为开发资金不足,无法买断整理本的版权,只好舍近求远,回过头去找未经整理的白文本输 入。这种权宜之计,大大贬损了资料库的学术价值,无异于自我毁灭行为。还有一种变相使 用整理本的方式,将整理本改头换面,只取其正文,不录其校注,孰不知校注本的正文如有 改动,你盲目照搬,又不加说明,那你输入的文本是何种版本就只有天晓得了。所以,我再 三呼吁,资料库的制作方要和古籍文本的整理方密切合作。为维护软件的版权,打击盗版行 为,资料库的制作方、古籍文本的整理方还要和出版方结成统一战线。我衷心预祝,在三方 通力协作下,汉文史资料库的建设能够不断推出具有版本价值、符合学术规范、容量巨大、 类型多样、使用便捷的新成果。

 


北京市丰台区太平桥西里38号 邮编 100073

 

国学网站,版权专有;引用转载,注明出处;肆意盗用,即为侵权。
guoxue@guoxue.com 010-68900123