第六届中国古籍数字化国际学术研讨会在京召开

  2017年9月17—18日,由首都师范大学电子文献研究所、中国诗歌研究中心共同主办的“第六届中国古籍数字化国际学术研讨会”在北京紫玉饭店召开。来自海内外高校及科研、出版机构、文博系统的50余名专家学者,包括日本、埃及、越南、马来西亚等国家的专家出席了会议。

20170917_001

  中国古籍数字化国际学术研讨会自2007年召开以来,每两年一届,已成功举办五届,到本届刚好迎来十周年。本次会议以“人工智能时代的古籍数字化”为主题,重点探讨人工智能对中文古籍数字化的影响、移动终端古籍数据库的研究与设计、中文古籍版本识别、中文古籍非常规字形识别(诸如手抄、印章、书法等)、中文古籍图形数据库建设、基于自动比对和自动排版的古籍大规模整理出版、古籍数字化教学与实践、古籍数字化公共资源研究、中医古籍数字化研究等前研课题,希望为中国古籍数字化探索出一条可持续发展的创新之路。

  开幕式由中国诗歌研究中心主任赵敏俐教授主持,他由仓颉造字“天雨粟,鬼夜哭”的神话谈起,讲到文字的发明是人类掌握世界的开始,而文字传播载体的每一次改变,都得益于科技的革命性进步,从早期的简帛,到后来的纸张,再到现在的电子媒体,古籍文献的传承形式一直在变,随着人工智能时代的来临,其迅猛发展的态势可能超出我们的想象。比如《周易》,伏羲造八卦,文王演六十四卦,孔子作十翼传,人更三圣,世历三古,这是《周易》的传承历史,将来我们会看到的什么样的《周易》,着实令人向往。

  首都师范大学方复全副校长致欢迎词,讲到首都师范大学在十年间见证了古籍数字化从兴起到兴盛的奋进历程,见证了信息技术对古籍整理和研究的巨大革命。如今古籍数字化的理念已经深入人心,数字化就像一把神奇的钥匙,打开了尘封已久的宝库,让那些记录在竹帛纸卷上的文字重被唤醒,以一种全新的面貌进入我们的生活,古籍从来没有像现在这样容易亲近。乘着数字化的翅膀,古籍可以轻易摆脱束缚,真正为大众所共享。他还介绍了首师大十年来在古籍数字化领域的探索和成果。从2004年成立全国高校系统第一个电子文献研究所,到2008年创立北京市重点交叉学科“数字文献学”,到2014年建立数字文献实验室,再2016年提出面向中小学的“数字国学馆”的理念,可说是两年一小步,十年一大步。不久前,国务院刚刚印发了《新一代人工智能发展规划》,将人工智能提升到国家战略的高度,从顶层设计抢抓战略机遇。这无疑预示了古籍数字化未来的发展方向和趋势。

  全国高校古籍整理研究工作委员会卢伟主任代表古委会致欢迎词,对于首师大电子文献研究所在古籍数字化领域的工作的贡献予以了充分肯定和赞赏,特别提到自己已连续参加六届古籍会,同样可说是古籍会的见证者,非常高兴看到古籍数字化又将跨入人工智能的新时代,前途可期,后继有人。

  北京大学中国古代史研究中心主任张希清教授、吉林大学中文系主任沈文凡教授分别代表嘉宾致词,各自谈到与首师大电子文献研究所多年来的无间合作。他们作为《国学宝典》的首批用户,是古籍数字化成果最早的受益者,后来又共同投入建设中来,与首师大电子文献研究所合作研发了《宋辽夏金元史料库》、《中国文化通志》等专题数据库,并参与了首师大电子文献研究所主持的《中国易学全书》整理工程,对于古籍数字化的发展和影响感同身受。张希清教授希望利用人工智能技术实现古籍的自动标点、自动校勘、自动整理,推动古籍数字化向更高阶段发展。沈文凡教授认为,古籍数字化是对传统思维方式的彻底颠覆,借助更先进的人工智能技术,或许有望破解隐藏在上古文字、神秘文化、诗词曲赋中的文化密码,进而探寻祖先们的精神世界。

  日本广岛大学副校长寺本康俊教授、埃及明亚大学文学院伊斯兰考古学系Mahmoud Masoud Ibrahim教授分别代表海外专家发言。寺本康俊教授介绍了广岛大学图书馆的历史、现状和新功能,Mahmoud教授介绍了埃及国家图书馆的古文字手稿抄本等的收藏保护情况。东西文明在此交汇,古籍的传承是人类共同的责任,不因地域而有差别。

  当天下午,会议移师国家数字出版基地,全体嘉宾兴致勃勃地参观了建于此处的数字文献实验室。首师大电子文献研究所尹小林所长发表了《人工智能与古籍数字化发展》的主题报告。人工智能(Artificial Intelligence),英文缩写为AI,是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学。十年后,人工智能将取代世界上50%的工作,人工智能不是“模仿人类”,而是“远超人类”。2016年3月15日,AlphaGo以4:1战胜世界围棋冠军李世石,这一事件宣告人工智能时代的真正来临。而具体到人工智能对古籍整理的影响,则意味着不久的将来,许多古籍方面的专业工作,诸如标点、校勘、翻译,甚至考证、分析、研究等等,都有可能被机器逐一取代。

  首师大电子文献研究所早在几年前就已经密切关注工人工智能领域的发展,独创的“自动比对”、“自动标点”、“自动排版”三大核心技术,已经运用于《中华传世藏书》这样大规模古籍文献的整理,即将结出丰硕的成果。近两年,数字文献实验室又陆续与不同领域的科研机构合作,引进研发了国学宝典小机器人、传统文化体验平台、国学虚拟体验平台等,并正在集中技术力量研发经典诵读语音分析系统、诗词移动终端检索分析系统等等。

  展望未来,运用人工智能,古籍数字化将有可能取得四大突破:一是突破语言限制,实现文言文和白话文之间的自动翻译;二是突破时空限制,实现历史场景的虚拟重现,以及历史人物和事件在虚拟时空中的自动联系;三是突破专业限制,实现古籍的自动点校;四是突破思维限制,实现对重大学术课题自动进行数据挖掘和逻辑分析。在人工智能时代,古籍数字化必将大有可为,跨入一个全新的境界。

  次日的专场讨论,上半场由首都师范大学文学院左东岭教授主持,下半场由华东师范大学中文系胡晓明教授主持。

  左东岭教授认为电子文献是划时代的产物,对古籍数字化的未来寄予宏愿,希望古籍数字化能在精度、广度、深度上更上层楼,争取做到更大、更快、更好,并提倡加强古籍数字化行业的内部合作,实现资料共享,尊重相互权利和生产方式。

  胡晓明教授认为,古籍数字化给学术研究所带来的便利是勿庸置疑的,比如年谱的整理就受益极大。百年以来,由于五四新文化运动的引领,中国学术界受西方思想影响颇深,大量的学术观念来自西方,学术史写作也充满西方话语,如何通过古籍数字化手段突破这种陈陈相因的积习,构建我们自己的数字人文,需要大家认真思考。人工智能作为古籍数字化的未来趋势,必将给人文学科带来极大冲击,在运用它推动进步的同时,也有警惕它可能产生的负面影响。

  与会专家学者们围绕人工智能的议题,进行了热烈交流和深入探讨,并展示了各自的研究成果。

  首都师范大学周文业教授讲解了中国传统文化数字化研究中心研发的“中国文学地理学信息平台”和“古代小说版本数字化研究平台”。“中国文学地理学信息平台”是利用GIS和数据库所构建的应用平台,平台根据用户的研究需要,创建一个以时间、地点、人物三维的立体时空数据库。用户将相关数据按照时间、地点和人物等,逐一输入数据库,系统即可自动进行检索、统计,并自动生成各种专题历史地图。“古代小说版本数字化研究平台”利用计算机可完成小说各种版本的自动比对,包括文字比对和插图比对两种。

  中南民族大学邵大为讲师代表王兆鹏教授讲解了他们的团队研发的“唐宋文学编年地图”。通过这张集人物、作品、时间、地点、事件五要素于一体的多维地图,可以一目看尽某作家一生的行踪,某时段所有“在场”作家的活动,某地方所有“相关”作家的活动,从而跳脱出限知视角,转换成全知视角。

  金陵科技学院葛怀东教授阐述了古籍再生保护背景下的古籍数字化课程建设问题,认为古籍数字化是一项系统化工程,不仅涉及传统古籍整理的知识和技能,诸如版本、目录、校勘等,而且还涵盖当前最成熟的信息技术,包括古籍专用OCR自动识别技术、汉字字符集编码、古籍数字化图像处理、元数据标准、数据挖掘、GIS等。古籍数字化课程群应包括:中国古典文献学、目录学、文献数据库设计、数字文本处理、古籍数字化、文献复制技术、图文设计与制作、古籍信息系统开发、编辑出版实务与技能、文化市场营销等,开展古籍书目信息著录、古籍数据采集与加工、古籍文献仿真与复制、数据库产品推广等方面的专业教学

  黑龙江大学李先耕教授从钱批本《论衡》用字谈到古籍用汉字库问题。中央民族大学曹立波教授以《红楼梦》为例,分析了古籍数字化在相关研究方面的突出作用。中华书局刘尚慈编审通过《十三经注疏》在整理项目,讲述了古籍数字化在此过程中的运用和价值。北京书同文数字化技术有限公司张驰宜代表特别谈到了盗版难以维权的业内难题,为此书同文推出了“众包系统”,将任务打散拆包加密,通过平台发放任务,防止合成数据的泄露。

  此外,中国人民大学国学院薛天纬、河北大学宋史研究中心姜锡东、浙江师范大学黄灵庚、天津师范大学周延良、广州大典研究中心王富鹏、山西运城学院李安纲、泉州师范学院杨秋生、四川外国语大学申红义、商务印书馆卢仁龙等专家学者也都就各自研究领域积极参加了讨论。

  闭幕式上,首师大电子文献研究所尹小林所长代表会议主办致以美好寄语,对于新朋友致以一个“快”字:时不我待,只争朝夕;对于老朋友致以一个“慢”字:古之学者为己,今之学者为人,做自己感兴趣的事业。

  

Comments are closed.