|
|
|
1.缘起
1987年,美国研究图书馆组织(RLG)提出了一项“编制全美进而可能是全世界现藏中国古籍 善本书机读联合目录的计划”——中国古籍善本国际联合目录计划,中国大陆的北京大学图 书馆、中国科学院图书馆、辽宁省图书馆等数家图书馆先后加入。海外机构的古籍联合建库 尝试显然对中国大陆的图书馆界有所启示与触动。作为国务院古籍整理出版规划小组(今称 “全国古籍整理出版规划领导小组”)的“ 机关刊物”,《古籍整理出版情况简报》1990年5月第225期发表了《一次编制中国古籍善本 书机读联合目录的试验》,肯定了中国古籍著录可以采用国际文献著录标准和方法,在其 基础上编制机读目录,并认为“计算机有宽广的检索与组合功能,贮入的资料可随时调整、 修正,陆续积累。计算机编目可产生多种次生功能,节约大量机械与重复性劳动,是一条必 行之路”。此后李致忠、沈乃文等图书馆界的古籍专家先后撰文,呼吁建立中国自己的古籍 书目数据库,李致忠在《关于建立中国古籍书目数据库的倡议》中更明确了联合建库的“五 个统一”即:统一古籍分类法、著录标准、数据格式、编目软件及字库。1995年国家古籍整 理出版规划小组(今称“全国古籍整理出版规划领导小组”)决定筹建中国古籍书目数据库。 不过此后,由于诸种原因,全国范围内古 籍联合机读目录的编目一直未能付诸于实践。代之而起的倒是各馆自行其是,南京图书馆、 辽宁图书馆、浙江图书馆、上海图书馆等地方馆陆续建立自己的古籍书目数据,国家图书馆 亦于1999年开始了古籍书目数据库建设,迄今完成了30余万条的古籍书目数据。高校中北京 大学图书馆也在2001年用DC元数据格式开始了古籍书目回溯建库,迄今完成了6万余条古籍 机读数据。由于各馆在编目软件、数据格式、著录文字等方面均存在差异(如国家图书馆使 用MARC格式,北京大学图书馆使用DC元数据格式;上海图书馆使用繁体字著录,国家图书馆 用简体字著录),因此数据的交换无法直接进行,只能通过专门的软件作为中介,进行格式 和文字方面的统一。即使这样,由于著录标准上的差异,今后即便能将这些数据汇入统一的 数据库进行检索或作跨库检索,也会给读者的使用带来诸多不便。
中国高校的CALIS联机合作编目组织在普通中西文图书的联机编目方面已取得相当的进展, 并获得宝贵的经验。鉴于古籍在图书馆藏书中的特殊位置,及其在高校的传统文化学科教学 与科研中的重要作用,CALIS组织决定将联机编目延伸至古籍。由于高校中的多数成员馆尚 未涉足古籍编目,因此CALIS中心希望从开始就作好设计工作,确定具有前瞻性的、尽可能 完善而且统一的著录规则,并统一软件,统一数据格式,从而使高校的古籍书目数据库在今 后的发展中,少走弯路,并能对全国图书馆界的古籍联合编目提供示范。CALIS中心为此用 了两年多的时间进行编目软件的设计和联机合作编目规则的制定。
2.规则与软件
2001年10月14至16日CALIS联机编目中心召集清华、人大、北师大、复旦、华东师大、南开 、吉大、南大、武大、川大、北大等高校图书馆负责此项业务工作的同志,以及国家图书馆 、南京图书馆、辽宁图书馆、科学院图书馆的有关专家,共30余人,对CALIS古籍联机合作 编目的各项议题进行了集中、深入的讨论,会议标志着CALIS古籍联机合作编目项目正式启 动。
会后,项目负责人谢琴芳即组织北大、清华、人大、北师大、复旦、武大图书馆相关人员开 始编写《CALIS古籍联机合作编目规则》;同时开始编目软件的设计开发。
《CALIS古籍联机合作编目规则》(以下简称CALIS规则)于2003年定稿。与国家图书馆已编写 的《汉语文古籍机读格式使用手册》(以下简称国图规则)相比,前者更注重遵循客观著录的 原则。照此原则:①书名与责任说明项、版本类型项、抄刻项等项目必须照录。载体形态项 的文献数量使用阿拉伯数字。附注项中的引用文字也应该照录。②凡取自规定信息源以外的 信息,或编目员自拟的著录信息均需置于“[]”内,并在附注项中加以说明。具体言之 ,如规定信息源中的文字出现错误时仍需照录,并在附注项中予以说明更正,视情况给予 检索点;规定信息源的文字不完整或意义不明晰时,需要补充说明的文字应置于“[]” 内;规定的各信息源未提供所需的信息时,由编目人员代拟或给予的信息亦需置于“[] ”内。总之。“[]”是区别著录内容是否据指定信息源客观记录的标志。这些在1996年 广东人民出版社出版的《中国文献编目规则》的“古籍”部分均有规定。《国图规则》显然 没有体现客观著录的原则。明显的例子:如其关于200字段责任者著录的规定,凡1912年以 前去世的中国责任者名称前均统一加“()”标明朝代;年号纪年一律换算为公元纪年,也 置 于“()”内。而在《CALIS规则》中则规定:责任者说明“原则上照录正文首卷卷端原题 的朝代、作者名称、著作方式。如卷端原题未标明朝代、作者名称,可自文献他处获取及文 献之外获取信息加以著录,并置于方括号内”;出版发行各项亦如此规定,即规定信息源未 载该项信息时,可经考查著录,考查所得的结果置于“[]”内,例如其关于抄刻时间的 规定,“抄刻时间按原题纪年照录,并转换为公元纪年,著录于方括号内;如遇甲子纪年或 其他纪年,应同时转换为年号纪年及公元年,置于方括号内”。两相比较,《国图规则》虽 然形式上MARC化了,但实质仍延续了传统卡片或书本式著录的习惯。
CALIS联机编目客观端系统软件由CALIS技术中心和北京开元数图科技有限公司开发。考虑到 古籍编目人员中图书馆专业出身的少,而具有文史专业背景的研究型人员占多数,他们可能 一时难以适应复杂繁琐的MARC格式,因此该软件做了以下特别的设计:①除了提供传统的MA RC编辑界面外,另外增加了文字编辑界面。文字界面将原来隐形的MARC字段、子字段及指示 符用明白的文字表示。例如200字段的$a用“正题名”表示,$f用正题名第一责任者表示;7 01字段的$a、$c、$f、$4分别用主要责任者的个人名称、籍贯职衔、年代、责任方式表示。 ②在某些字段之间建立自动关联,例如输入古籍一般特征字段(193字段)的印刷技术代码即 可生成关联的205字段$a的版本说明信息,插图代码可生成215字段$c的图表信息。③提供了 一些字段信息的选择框,如书籍内容、印刷技术、出版日期类型的选择框,编目员可以在下 拉菜单中选择相应的信息,既省去记忆代码之苦,手工输入之劳,又提高了精确度。此外, 根据古籍编目的特点,联机编目的客户端支持每条记录同时链接三个书影,编目员可以同时 调看最多三个书影进行比对,以帮助版本的鉴定。考虑到一些图书馆的本地库无法兼容繁体 字的存储与显示,联机编目的客户端具备了繁简字的转化功能,并支持繁/简字的导入、导 出、上载功能。
3.联机编目的起步:成就与问题
2003年12月17—19日,来自清华、人大、北师大、复旦、吉大、南大、武大、川大、北大 9个图书馆的18名编目员参加了首批古籍联合目录编目客户端软件应用和古籍编目规则的培 训。之后各馆开始向CALIS中心上载古籍编目数据。截至2004年5月中旬,共上载数据7000多 条。这其间自然包括个别图书馆将原来早已存放于本地库的已编数据导入CALIS库,即便如 此,考虑到高校古籍编目人员稀少的状况,这样的编目速度仍然是令人满意的。更为重要的 是,在这几个月的时间内,一些从未有过机编经验的古籍编目人员通过边学习边实践,基本 掌握了联机编目的规则和相关软件的运用。由于图书经费的紧张,一些高校早已停止采购原 版古籍,导致近几年新进的一批古籍编目人员缺乏古籍版本鉴定和四部分类的实际经验。CA LIS鼓励各成员馆重新以原书进行版本鉴定和详细著录,实际上培养和提高了古籍编目人员 版本鉴定及分编的能力,从而有利于高校图书馆古籍整理人才的成长。
由于CALIS古籍联机编目几乎是一个从零开始的事物,因此其存在一些令人不太惬意之处又 是难免的。具体言之,有如下几个方面:
①客观著录的原则未能完全贯彻:由于传统著录习惯的根深蒂固,《CALIS规则》中一些有 关客观著录的具体规定未被严格遵守。例如按照《CALIS规则》的规定,古籍中正文或附录 部分若未分卷,则不著录卷数。但目前提交的记录中,仍按传统的习惯径直著录为“不分卷 ”或“一卷”而又不加“[]”的数据仍不在少数;一些地名分明是考证的结果,如不少 “淮南书局”的刻本,205字段$a的“扬州”,多系查找工具书而来,却未加“[]”; 一些古籍的刻书地在序跋交代得很清楚,但却仍然被著录为“抄刻地不详”,显然是受传统 著录的影响——不重视刻书地的著录所导致;个别著录更为随意,甚而在210字段出现了像 “推测最早抄刻年×××”这样的文字。
②一些古籍的版本鉴定存在问题:古籍版本的鉴定是机读数据质量的保证。由于古籍版本的 复杂性,加之一些编目人员缺乏版本鉴定的实践经验或是疏忽,导致了目前提交的记录中存 在明显的版本鉴定错误。这其中又以翻刻本、后印本、增修本的著录问题居多。如《澳门记 略》,此书清光绪六年重印的清嘉庆五年本即因内封面镌有“光绪庚辰重刊于江宁藩署”而 被定为光绪六年的重刻本,其实比对数据库中另一条内封面镌“嘉庆庚申重刊于江宁藩署” 的记录,不难发现两书仅是印次的区别。再如著录为清康熙四十二年善成堂刻的《杜诗详注 》实为清康熙间左岘等原刻的坊间翻刻本,编目员仅据康熙四十二年仇兆鳌的一则附记和“ 善成堂藏板”的牌记而确定了此书的版本显然有欠严谨。而作为此书附刻的《杜诗详注》还 有一则仇氏癸巳[康熙五十二年]的附记,则更不应该著录为四十二年的版本了。
尽管CALIS目前不希望各馆提供丛书零种的记录,但仍有零种的记录被当为单行本上载。其 原因在于编目员在确定某一种古籍是单行本还是丛书零种时存在困难,又不愿意查阅相关的 工具书。如果一丛书零种的身份得不到确认,则势必影响其将来与高层记录的连接。
③《CALIS规则》仍有待修改、完善、明晰:由于对规则的理解不同,可能会出现同一种古 籍被处理成不同的记录。明显的如合刻的理解,一些编目员将凡属于有完整题名的附录全部 作为合刻记录,彼此间用423字段进行连接,这与将古籍正文部分做一条记录,附录仅在517 字段做一检索点显然不同。甚至,一些有总题名的“总集”亦被分成几条合刻记录,这与仅 将分集内容置于327字段,然后在517字段提供检索又不同。如果同一种书在数据库中被处理 成不同记录的情况不断增多,很可能给读者的检索造成混乱。很显然,在规则中就必须对“ 合刻”进行明确的界定,并对其数据的处理进行统一规定。
《CALIS规则》认为行款版式附注对古籍而言特别重要,因此307字段成为记录的必备字段, 但比之更为重要的出版发行等附注(306字段)却没有受到应有的重视,一些记录由于缺乏有 关序跋、牌记等相关的附注信息,读者无从知晓其版本判定的依据,数据的可靠性因此大打 折扣。更为严重的是,这可能给版本确定的主观随意打开方便之门。因此,有必要将306字 段作为详编记录的必备字段。
其他可以完善、明晰之处,恕不一一列举。
4.几点建议
①修改、完善和细化编目规则:如前文的所述,目前的《CALIS规则》仍存在着不够完善、 有待修改和细化的地方,因此有必要加以修订。此不赘言。
②加强数据质量的控制:目前的CALIS古籍联机编目数据以每日近百条的速度迅速增长,数 据的质量问题亦日益突出。如果CALIS古籍联机编目中心不尽快组织成立古籍联机编目的数 据质量控制组,对一些数据进行及时修改,问题有可能积重难返。鉴于目前高校图书馆的实 际情况,其成员大体可包括两类人,一类是精于古籍版本鉴定的中老年专家,另一类是对于 机 读编目规则掌握较快的年轻一代图书馆员。成员应该定期浏览新近上载的数据,通过网络进 行交流、沟通、讨论,为古籍的版本鉴定提供帮助,对于错误的记录及时进行修正,对重复 记录进行合并。成员应该有定期的讨论会,与CALIS古籍联机编目中心一起对阶段性的工作 进行总结。
③加强人员培训:随着成员馆的逐渐增加,CALIS中心应该加强古籍编目人员的培训。培训 的内容不应该局限于古籍编目规则和编目客户端软件的应用,针对古籍编目人员的特点,还 应包括古籍版本鉴定以及主题标引等。在师资方面,CALIS完全可以依托北京大学等高校图 书馆,甚至邻近公共图书馆的力量。
④扩大成员馆:CALIS古籍联机编目应该稳步扩大成员馆,不仅应该将所有藏有古籍的高校 馆纳入其间,在条件成熟时,更应鼓励公共图书馆加入。这样做不仅有助于更多古籍版本的 相互比对,从而提高数据的质量,更为重要的是,它将最大可能地容纳中国大陆现存古籍的 机读书目数据,从而有可能成为中国大陆较为完备的古籍机读书目数据库,实现十数年来图 书馆古籍界众多专家的夙愿。
北京市丰台区太平桥西里38号 邮编 100073
|
|