在《中华传世藏书》首发仪式暨出版座谈会上的讲话
尊敬的各位领导、各位来宾:
上午好!
今天,看着煌煌166册的《中华传世藏书》齐齐整整地排列在人民大会堂浙江厅,心情非常激动。首先要感谢全国一百多位参与这套丛书的专家学者,2亿字的传世经典,每一字每一句都经过他们精心点勘,其中部分学者今天来到了大会堂,共同见证全书面世这一重要时刻;其次,要感谢浙江出版联合集团,他们以敢为天下先的勇气和胆识,投入大量物力人力,做出了出版这套宏篇巨制的决定;感谢浙江人民出版社的领导和编辑人员,他们不畏艰辛,熬了无数个日日夜夜,精推细敲,严守每一个出版细节,保证全书总体质量;最后,要感谢尊敬的许嘉璐副委员长多年来对我所做的古籍数据库工作给予的多方指导和大力支持,感谢刘梦溪先生、白化文先生对我的关心和帮助,感谢单霁翔先生、吴杰民先生对出版工程的充分肯定和支持。当然,我还要特别感谢今天到会的各界同仁和媒体朋友,正是你们的积极参与,才使《中华传世藏书》出版工程更加光彩夺目。
一、《中华传世藏书》是对传统经典的一次大规模集结,也是对中华文化的一次全方位整理。
中华文化历史悠久,底蕴深厚,从统一中国的方块汉字,到改变世界的四大发明,从灿若群星的诸子百家,到美不胜收的唐诗宋词,无不彰显出中华文化独一无二的气质。中华民族之所以能绵延五千年而不衰,正是源于中华文化无比强大无比坚韧的生命力。
这种生命力,来自《周易》“自强不息,厚德载物”的天地启示,来自《尚书》“民惟邦本,本固邦宁”的祖先训诫,来自《论语》“己所不欲,勿施于人”的圣贤教诲,来自《诗经》“昔我往矣,杨柳依依;今我来思,雨雪霏霏”的那一缕永恒乡愁。若要给这种生命力寻找依托,无论如何都绕不开这些传统经典。
所谓传统经典,就是从古流传至今具有普遍价值和持久影响的著作,是先贤们仰观俯察的体悟,哲思灵性的结晶。它们历经时间的考验,常读常新,不因岁月更迭而褪色,不因世事变迁而磨灭。它们不是泛黄的故纸堆,不是陈旧的老古董,对于每一个时代来说,它们都是鲜活的。
传统经典中所包涵的智慧,不但可以使我们看清来路,更可以为我们照亮去路,心有明灯,便不会迷失方向。尤其在当前的中国,经济面临转型,亟需政治的深度改革,而政治改革又亟需文化的强力支撑。这个支撑不能凭借外势,只能反求己身,从传统经典中去汲取源源不断的内生动能。
二、《中华传世藏书》是国学大数据和人工智能在古籍出版界的一次成功应用。
自上个世纪90年代以来,随着信息技术的发展,掀起了古籍数字化的浪潮,令传统经典得以摆脱竹帛纸卷的束缚,以数据库这样一种全新的面貌进入我们的生活,真正为大众所共享,这无疑是一场划时代的革命。如今,建立超大规模古籍数据库已成为社会共识,无论从国家文化战略层面,还是从大众文化自信层面,对于传统经典的需求都从未像如今这般迫切。
我大学一毕业就在部队服役,有幸在32年前就开始接触计算机,又因为喜欢国学,便在工作之余,尝试应用自己所学的编程技术,于1997年独自研发了《全唐诗》检索系统,1999年又创建了《国学宝典》数据库,由此打开了古籍数字化的大门。2002年转业后,我做的第一件事,就是用转业费作为启动资金,成立了专门致力于古籍数字化的国学公司。而今十六年过去,《国学宝典》也已从当初的几千万字扩充到现在的20亿字。
有了这样的大数据库作为基础,将人工智能引入古籍数字化领域,就成为顺理成章的事。近些年,我们通过对《国学宝典》进行人工智能分析运算,先后研发出“自动比对”、“自动标点”、“自动排版”三大核心技术。《新华每日电讯》曾以《跨越历史天堑,攻克古籍数字化瓶颈》为标题报道了这三大核心技术。
自动比对技术能自动进行多种版本古籍的逐字比对,标示出文字和符号的任何差异,并直接输出精确的校勘记录。
自动标点技术是基于对大规模带标点文本的分析统计,以句型为基础,辅以语法分析和字词切分技术,通过模糊查找和分段比对,能对无标点的古籍文献自动加上合适的标点符号,理想状态下准确率可达90%以上。
自动排印技术能将数据库文件迅速转换为方正排版文件,实现设计、排版、出片、打样、印刷“一条龙”,并较好地解决了古籍生僻字造字、简繁体转换、横竖版式等多项技术难点。
借助此三大核心技术,得以免除许多繁琐的重复劳动,将古籍整理出版的效率和质量提升数倍,既节省了宝贵的人力,又极大降低了成本,从而使大规模古籍的整理和出版成为可能。而且越是规范的数据库,优势就越明显,差不多一台计算机可以代替100名校对人员或排版人员的工作量,其应用价值不言而喻。
这种应用的最直接成果,就是我们今天的主角《中华传世藏书》。可以说,如果没有三大核心技术,就不可能有《中华传世藏书》的诞生。《中华传世藏书》是对我们此前二十年古籍数字化工作的大考验和大总结,为此我们进行了多种尝试,攻克了多道难关,造就了《中华传世藏书》四个特点:
一是编目合理。大型丛书选目和排序最能体现选编者的格局和眼光,也是评判其水平高下的主要标准。
二是底本权威。近二十年来,影印古籍大量出版,以及大型公共图书馆陆续发布了许多优质古籍的扫描图片,从根本上保证了丛书的质量。
三是内容完整。所选690种经典均为全本,这是与此前出版的同类图书明显差异。
四是版式规范。我们投入了很大物力人力,从历代精刻底本中选取了两千余幅版刻插图,重新绘制了许多与科技、中医、农学等有关的矢量图,力求图文并茂,方便阅读。为保证版式的美观整洁,我们专门升级了打印字库,使得数以万计的各种特殊符号和生僻疑难字形,均可以在同一平台下顺利显示。
三、《中华传世藏书》传承和弘扬优秀传统文化的一个新起点。
人工智能经过数十年的沉淀,已经发展到了具有自我学习和修复能力的新高度。古籍整理本身学术含量很高,人工智能虽然不能替代专家的工作,但已经可以解决许多复杂问题。这次编纂《中华传世藏书》,我们组织了全国数十所高校及科研单位的古籍专家参与审定,并汲取了现有可资借鉴的古籍整理成果,最终了实现人工和机器的完美合作。
《中华传世藏书》是古籍数字化背景下大数据库和人工智能结合的产物,标志着传统经典在现代社会的传播跨入了一个崭新的阶段,从量的积累到质的飞跃。在可以预见的将来,人工智能必将促进古籍数字化取得更大突破,除了比对、标点、排版之外,甚至校勘、翻译、考证、分析、研究等等,都有可能被机器实现。
在以移动终端为主流的今天,多种数据格式、多种显示平台的共生共享,个性化输出、网络化阅读、智能化出版,古籍全数字化等一个个新的目标等着我们去攻克。《中华传世藏书》的出版,为我们打造了一个更高更新的平台,必将激发出中华文化新的活力。
前方风景无限,国学大有可为!
二〇一八年十月二十二日