www.guoxue.com
古籍整理留言薄



“《全宋诗》分析系统”通过教育部技术鉴定


张剑
2005年
 
 
 
 
 

第七期(总413期)

 

第八期(总414期)

 
 
  第十一期(总417期)
  第十二期(总418期)

 

  2005年1月16日,由北京大学中文系李铎博士承担的国家“十五”“211工程”项目子 项目“ 中国语言文学教学和基础理论及应用研究平台建设”的子课题——“《全宋诗》分析系统” 通过了教育部主持的技术鉴定。

  鉴定会由教育部科研成果处张劲松主持,北京大学副校长吴志攀到会致词。来自中国古代文 学、文献学、语言学、计算机科学界四个领域的专家组成了鉴定委员会,傅璇琮任主任委员 ,陶文鹏、刘跃进、韩经太等九位专家任委员。专家们认真听取了该项目组的系统研制报告 、查新报告、专家测试组的测试报告,并现场观看了系统演示。经过认真评审、质询答疑 ,认为 该项目不仅达到了预定的各项指标要求,而且突破了以往的全文检索的信息提供模式,在数 据深层挖掘和知识发现方面具有开创性意义。其重出诗提取、格律诗标注、字及字组的频率 分布统计、用户自作诗的格律分析等带有智能化特点,该系统提供多维的检索分析方式,为 中国古代文学、古代汉语、文献学等研究领域提供了可靠的分析数据。它标志着,计算机科 学在中文信息处理应用方面由全文检索的信息提供模式开始转向智能分析模式。
  如“重出诗检索”方面,输入“苏轼”后点击“重出诗查询”可以检索出苏轼与他人重出诗 作47首,同时也支持空检索,可检索出全部4974首重出诗。“小传检索”方面,输入任意字 词,可以仅检索小传内容,如输入“北京”,可以检索出所有与北京相关的诗人小传。“数 据统计”方面,输入“春风”,作者限制为“苏〖JP1〗轼”,可以得到以下5类信息:全宋 诗中共有6097个“春风”;苏轼作品中共有58个“春风”;使用“春风”最多的前十位诗人;以字 为单位使用频率最高的前十位诗人;以首为单位使用频率最高的前十位诗人。高级检索是该 分析系统功能最强大的检索组,它支持通配符的使用,如输入“春?风”,可以检索到“春 信风生晚汛潮”;为了语言学和文学的研究,该检索还支持多维检索,如输入“梨or花or院 or落”,点击“复合检索”,可以检索出全部含有四字的十四首诗,及十多种搭配的组合; 另外该系统还能够进行“位置检索”,在输入检索内容后,可以以数字的形式,在位置检索 中输入位于诗句位置,输入“0”则表示结尾,这项功能非常适合学术研究,可以去掉很多 无用信息。

  据李铎博士介绍,该项目数据源为傅璇琮、孙钦善等先生主编的《全宋诗》,这套纸介书由 北京大学出版社出版,并获得国家图书奖,是目前关于宋诗总集的最好的本子。可以想像, 如果今 后能够形成更强大的中国古代诗歌研究平台,并将其应用于已整理的中国古代诗歌文献数据 ,如《诗经》、《先秦汉魏六朝诗》、《全唐诗》、《全宋词》等,整个中国古典文献的整 理和研究将会展示出更为广阔的前景。

 

国学网站,版权专有;引用转载,注明出处;肆意盗用,即为侵权。
guoxue@guoxue.com 010-68900123