中国古典文学数字化进程中的定量研究和争鸣
——兼论唐戴叔伦编年系地信息平台建设

苗贵松1 孙钦荣2 苗地3

(1.2.常州工学院人文社科学院,江苏 常州 213022;3.南京中医药大学信息技术学院,江苏 南京 210046)

  【内容提要】文章从权威期刊、多产作者、博硕论文、国家基金项目等视角,统计出中国古典文学数字与量化研究主要文献222篇(大量会议论文除外)。论文论著多集中在唐宋文学范围,涵盖中国古代文学、中国古典文献学、汉语言文字学、世界文学与比较文学、应用心理学、计算机应用技术等学科,体现出鲜明的不平衡性和交叉性。王兆鹏、刘尊明尤为突出,较早将范式批评运用于古典文学。惯常思维的改变必然伴随着学术争鸣,尤其是在《唐诗排行榜》出版后。李炳海提出的定量、定性与定位三维观照系统,可为古典文学定量研究者的重要参考。戴叔伦编年系地信息研究主要以年谱或作品编年著作为依据,通过作家基本信息、活动编年、作品系年和人物关系库,创建动态的、具有资料查询、数据统计等功能的数字化地图平台。

  【关 键 词】古代文学;电子文献;戴叔伦;研究方法;学术争鸣

  一、古典文学数字化进程中的量化研究

  囿于信息技术的发展,上世纪80年代古典文学的量化研究,张三夕先生较早探讨把握作品数量和定量描述在古典文学研究中的意义[1],功不可没;90年代略有增加,虽也暂见10篇论文,但含金量较高,仅《文学遗产》和《文献》就发表4篇,见表1。

表1 中国古典文学数字与量化研究主要文献:权威期刊

序号 刊名 年期 题名 第一作者
1 中国社会科学 2002 (4) 中国古代文学的重数传统与数理美——兼及中国古代文学的数理批评 杜贵晨
2 中国社会科学 2011 (2) e-考据时代的新曹学研究:以曹振彦生平为例 黄一农
3 文学评论 2004 (1) 李贺鬼神诗的定量分析 陈友冰
4 文学评论 2007 (6) 数据库、计量分析与古代文学研究的现代化进程 尚永亮
5 文学评论 2008 (6) 宋词经典名篇的定量考察 王兆鹏
6 文学评论 2012 (5) 姜夔词史经典地位的历史嬗变 郁玉英
7 文学遗产 1995(4) 历史的选择──宋代词人历史地位的定量分析 王兆鹏
8 文学遗产 1997(1) 古代数字“三”的观念与小说的“三复”情节 杜贵晨
9 文学遗产 1999(6) 本世纪东坡词研究的定量分析──词学研究定量分析之一 刘尊明
10 文学遗产 2002(1) 元诗文献研究 杨 镰
11 文学遗产 2003 (6) 唐知名诗人之层级分布与代群发展的定量分析 尚永亮
12 文学遗产 2005(5) 古籍数字化与古典文学研究的未来 郑永晓
13 文学遗产 2008(1) 词谱检论 谢桃坊
14 文学遗产 2008(2) 寻找经典——唐诗百首名篇的定量分析 王兆鹏
15 文学遗产 2009 (1) 引信息的“术”入文学的“心”——谈情感计算和语义研究在文史领域的应用 罗凤珠
16 文学遗产 2012 (2) 建设中国文学数字化地图平台的构想 王兆鹏

  资料来源:根据中国知网检索数据统计整理

  其中王兆鹏、刘尊明先生尤为突出,他们从现存词作的篇数、宋词别集的版本种数、宋代词人在历代词话中被品评的次数、宋代词人在本世纪被研究、评论的论著篇(种)数历代词选中宋代词人入选的词作篇数、(当代)词选中两宋词人入选的词作篇数六方面的资料数据,尝试定量分析宋代词人的历史地位和影响[2],其研究方法影响后学很大。

  进入新世纪,中国古典文学数字化进程加快,定量研究方法得到广泛响应。除王兆鹏(14篇论文2部论著)、刘尊明(10篇论文1部论著)两先生继续拓展外,杜贵晨(5篇论文1部论著)、尚永亮(6篇论文)、郁玉英(6篇论文)踵事增华,陈友冰、李炳海、陈文新、郑永晓、罗凤珠、郭英德、孟彦、李铎、谢桃坊、费振刚等著名学者陆续加入,吴夏平、郁玉英、邓建、刘学、周文业等青年才俊亦为之增色,见表2。

表2 中国古典文学数字与量化研究主要文献:多产作者

序号 第一
作者
题名 报刊/出版社 年期
1 王兆鹏 昌盛与萧条——本世纪词学研究格局中的清词研究 鄂州大学学报 1995(1)
2 王兆鹏 历史的选择──宋代词人历史地位的定量分析 文学遗产 1995(4)
3 王兆鹏 简谈宋词繁荣昌盛的“量化”标志 古典文学知识 1996(5)
4 王兆鹏 宋词作品量的统计分析 光明日报 2001-11-28
5 王兆鹏 宋代文学研究现状的定量分析 光明日报 2002-10-09
6 王兆鹏 1997-1999年宋代文学研究论著及作者队伍的定量分析 湖北教育学院学报 2002(3)
7 王兆鹏 电子古籍文献检索资源概述 古典文学知识 2003(4)
8 王兆鹏 宋词作者的统计分析 文艺研究 2003 (6)
9 王兆鹏 三大功能:对未来数字化古籍的期待 中国社会科学院院报 2007-09-18
10 王兆鹏 影响的追寻——宋词名篇的计量分析 2008年词学国际学术研讨会论文集 2008
11 王兆鹏 寻找经典——唐诗百首名篇的定量分析 文学遗产 2008(2)
12 王兆鹏 宋词经典名篇的定量考察 文学评论 2008 (6)
13 王兆鹏 定量分析在唐宋词史研究中的运用 江西师大学报(哲社版) 2010 (1)
14 王兆鹏 20世纪词学研究成果量的阶段性变化及其原因 学术研究 2010 (6)
15 王兆鹏 新世纪以来词学研究的宏观走势 文学与文化 2011 (3)
16 王兆鹏 建设中国文学数字化地图平台的构想 文学遗产 2012 (2)
17 王兆鹏 谈文学排行榜的评价指标与权重设置——以唐诗宋词为中心 社会科学 2013 (2)
18 王兆鹏 唐诗排行榜 中华书局 2011
19 王兆鹏 宋词排行榜 中华书局 2012
20 刘尊明 从传播看李清照的词史地位——词学研究定量分析之一 文献 1997(3)
21 刘尊明 本世纪唐宋词研究的定量分析 湖北大学学报(哲社版) 1999(5)
22 刘尊明 本世纪东坡词研究的定量分析──词学研究定量分析之一 文学遗产 1999(6)
23 刘尊明 20世纪秦观词研究的定量分析 中国韵文学刊 2001(2)
24 刘尊明 历代词人次韵辛弃疾词的定量分析 纪念辛弃疾逝世800周年学术研讨会论文汇编 2007
25 刘尊明 历代词人追和李清照词的定量分析 合肥师范学院学报 2008(4)
26 刘尊明 中国文学史研究定量分析方法论 社科纵横 2010 (1)
27 刘尊明 历代词人次韵辛弃疾词的定量分析 黄冈师范学院学报 2010 (2)
28 刘尊明 历代词人次韵苏轼词的定量分析 深圳大学学报(人文社会科学版) 2010 (3)
29 刘尊明 历代词人次韵周邦彦词的定量分析 2010年词学国际学术研讨会论文集 2010
30 刘尊明 唐五代词人历史地位的定量分析 社会科学战线 2011 (3)
31 刘尊明 唐五代词作者队伍的定量分析 兰州大学学报(社科版) 2011 (3)
32 刘尊明 宋代词人词调运用的定量分析 中国文化研究 2012 (1)
33 刘尊明 唐宋词的定量分析 北京大学出版社 2012
34 尚永亮 唐知名诗人之层级分布与代群发展的定量分析 文学遗产 2003 (6)
35 尚永亮 八代诗歌分布情形与发展态势的定量分析 东南大学学报(哲社版) 2003 (6)
36 尚永亮 开天、元和两大诗人群交往诗创作及其变化的定量分析 江海学刊 2005 (2)
37 尚永亮 数据库、计量分析与古代文学研究的现代化进程 文学评论 2007 (6)
38 尚永亮 唐五代贬官之时空分布的定量分析 上海大学学报(社科版) 2007 (6)
39 尚永亮 名篇与选本——以元和十大诗人被选诗为中心的定量分析 学术论坛 2010 (9)
40 杜贵晨 古代数字“三”的观念与小说的“三复”情节 文学遗产 1997(1)
41 杜贵晨 中国古代文学的重数传统与数理美——兼及中国古代文学的数理批评 中国社会科学 2002 (4)
42 杜贵晨 “文学数理批评”论纲——以“中国古代文学数理批评”为中心的思考 山东师范大学学报(人文社科版) 2004 (1)
43 杜贵晨 《西游记》数理机制论要——从神秘数字出发的文学批评 山东师范大学学报(人文社科版) 2005 (1)
44 杜贵晨 中国文学数理批评的历史与现状 河北学刊 2009 (4)
45 杜贵晨 数理批评与小说考论 齐鲁书社 2006
46 郁玉英 清人词学视野中的宋词经典 江海学刊 2009 (1)
47 郁玉英 宋金词学视野中的宋词经典名篇论析 江汉论坛 2009 (11)
48 郁玉英 宋词第一名篇《念奴娇·赤壁怀古》经典化探析 齐鲁学刊 2009 (6)
49 郁玉英 透视当前关于文学经典的理论研究 宁夏大学学报(人文社会科学版) 2009 (6)
50 郁玉英 论文学传播中的共生现象及其对文学经典生成的影响 江西社会科学 2012 (3)
51 郁玉英 姜夔词史经典地位的历史嬗变 文学评论 2012 (5)
52 吴夏平 数据库与古代文学研究 光明日报 2004-09-29
53 吴夏平 古籍数字化与文献利用 中国社会科学院院报 2007-09-18
54 吴夏平 谁在左右学术——论古籍数字化与现代学术进程 山西师大学报(社科版) 2010 (3)
55 吴夏平 古籍数字化与学术异化 山西师大学报(社科版) 2012 (5)
56 郑永晓 古籍数字化与古典文学研究的未来 文学遗产 2005(5)
57 郑永晓 以GIS为例看信息技术在古典文学研究中的应用 第五届文学与资讯技术国际研讨会 2005
58 郑永晓 古籍数字化对学术的影响及其发展方向 社会科学管理与评论 2006 (4)
59 郑永晓 以GIS为例看信息技术在古典文学研究中的应用 重庆教育学院学报 2006 (5)
60 孟 彦 第二届中国古典小说数字化研讨会暨第二届《三国演义》版本研讨会综述 明清小说研究 2003(4)
61 孟 彦 第五届中国古代小说文献与数字化研讨会综述 明清小说研究 2006 (3)
62 孟 彦 第八届中国古代小说戏曲文献暨数字化国际研讨会综述 明清小说研究 2009 (3)
63 周文业 古代文献版本的计算机自动比对及在《三国演义》、《红楼梦》中的应用 第五届文学与资讯技术国际研讨会 2005
64 周文业 《水浒传》版本数字化及《京本忠义传》的数字化研究 第三届中国古籍数字化国际学术研讨会 2011
65 周文业 《水浒传》版本数字化及应用 水浒争鸣 2009
66 邓 建 20世纪柳永词传播的定量分析 学术交流 2006 (2)
67 邓 建 中国历代选本的格局分布及其文化意蕴 江汉论坛 2007 (11)
68 邓 建 《唐宋词的定量分析》的方法论意义与学术贡献 天中学刊 2012 (6)

  资料来源:根据中国知网检索数据统计整理

  2003年以后,博硕士异军突起,黄大宏、邓百意、张敏、毛建军、王伟伟、孙艳红、宋娟、尚雪红博士锦上添花,刘俊丽、陈诚、孙凯云、周静情、廖继莉、刘月琴、孟祥娟、刘博、张航、孙丽娜、胡玉、贺叶平、师莹、阚赤兵、陈国庆、严禹、刘凤、吴春龙、薛孟佳、石英、詹伟强、叶淑婧、方磊、叶振超、李小爽、黄英、翟惠、左英英、李伟煌、张帅等硕士后生可畏,中国古典文学数字与量化研究方兴未艾,见表3。

表3 中国古典文学数字与量化研究主要文献:博硕论文

序号 作者 题名 授予单位 年度
1 黄大宏 唐代小说重写研究(博士学位论文) 陕西师范大学 2003
2 邓百意 中国古代小说节奏论(博士学位论文) 复旦大学 2007
3 张 敏 《诗经》的认知诗学与心理分析研究(博士学位论文) 华南师范大学 2007
4 毛建军 古籍数字化理论研究(博士学位论文) 南京大学 2008
5 王伟伟 宋代社交词研究(博士学位论文) 山东师范大学 2010
6 孙艳红 宋词的女性化特征演变史(博士学位论文) 吉林大学 2012
7 宋 娟 宋代笔记在《全宋词》编纂中的史料价值(博士学位论文) 吉林大学 2012
8 尚雪红 东坡词思想研究(博士学位论文) 吉林大学 2012
9 陈 诚 论古典文献数字化(硕士学位论文) 苏州大学 2004
10 刘俊丽 宋诗作者队伍的定量分析(硕士学位论文) 武汉大学 2004
11 孙凯云 寻找经典——唐诗名篇定量分析(硕士学位论文) 武汉大学 2005
12 周静情 经典的选择(硕士学位论文) 武汉大学 2005
13 廖继莉 唐诗声律研究(硕士学位论文) 华中科技大学 2005
14 刘月琴 宋词“女性化”审美意识(硕士学位论文) 南京师范大学 2005
15 孟祥娟 汉末迄魏晋之际文学家族述论(硕士学位论文) 吉林大学 2005
16 刘 博 基于《文渊阁四库全书电子版》分析的我国古籍数字化问题与对策研究(硕士学位论文) 郑州大学 2006
17 张 航 姜夔词传播与接受研究(硕士学位论文) 福建师范大学 2006
18 孙丽娜 公元712-805年唐诗歌创作地理分布研究(硕士学位论文) 广西师范大学 2006
19 胡 玉 宋词格律研究(硕士学位论文) 华中科技大学 2006
20 贺叶平 中晚唐干谒散文研究(硕士学位论文) 华南师范大学 2007
21 师 莹 河南方志所载金代作家传记资料汇考(硕士学位论文) 山西大学 2007
22 阚赤兵 宋代女词人词作研究初探(硕士学位论文) 东北师范大学 2008
23 陈国庆 数字技术在古籍整理中的运用初编(硕士学位论文) 兰州大学 2008
24 严 禹 论唐传奇的超现实文本(硕士学位论文) 江西师范大学 2008
25 刘 凤 《江西诗征》明代部分数据库及其诗歌概说(硕士学位论文) 南昌大学 2008
26 吴春龙 宋词风格的计算机辅助分析研究(硕士学位论文) 厦门大学 2008
27 薛孟佳 宋代柳永词传播初探(硕士学位论文) 重庆大学 2009
28 石 英 建国后唐宋词选本研究(硕士学位论文) 聊城大学 2009
29 詹伟强 宋代江西文学家的地域分布及其文学影响(硕士学位论文) 江西财经大学 2009
30 叶淑婧 陆游入蜀诗和出蜀诗之比较研究(硕士学位论文) 福建师范大学 2009
31 方 磊 欧阳修散文经典的传播与接受(硕士学位论文) 福建师范大学 2010
32 叶振超 CADAL中国文学编年史系统的设计与实现(硕士学位论文) 浙江大学 2011
33 李小爽 从现存唐人选唐诗看唐诗独特风貌(硕士学位论文) 河南大学 2011
34 黄 英 陆游诗歌五十首经典名篇的考察(硕士学位论文) 江西师范大学 2011
35 翟 惠 《清诗别裁集》研究(硕士学位论文) 苏州大学 2011
36 左英英 中晚唐送别诗研究(硕士学位论文) 辽宁大学 2011
37 李伟煌 中国文学地理学论著的数理统计与分析(硕士学位论文) 广州大学 2012
38 张 帅 计算机辅助宋词研究(硕士学位论文) 北京大学 2012

  资料来源:根据中国知网检索数据统计整理

  30年来,我们检索到公开发表出版的,就有224项研究成果(分类略有交叉)。除了《中国社会科学》、《文学评论》、《文学遗产》等权威期刊和多产作者以及博硕士发表的古典文学数字化与量化研究论文论著外,还有其他100多位单篇学者,祥见表4。

表4 中国古典文学数字与量化研究主要作者:二篇以下

序号 第一
作者
题名 刊名/单位 年期
1 张三夕 作家作品研究中的数量分析——唐代诗人总数考实 徐州师院学报(哲社版) 1984 (2)
2 张三夕 古代文学研究中计量分析的应用与限度——由唐诗宋词排行榜引起的思考 社会科学 2013 (2)
3 蒋 寅 从《河岳英灵集》到《中兴间气集》——关于大历诗风演变的抽样分析与假说 广西师范大学学报(哲学社会科学版) 1984 (4)
4 戴伟华 唐代文学研究中的文人空间排序及其意义 扬州大学学报(人文社会科学版) 1999 (1)
5 陈满铭 论东坡清峻词中刚柔成分之量化 毕节师范高等专科学校学报 2004 (3)
6 陈满铭 稼轩“豪壮沉郁”词中刚柔成分之量化 南京晓庄学院学报 2013 (1)
7 刘 学 中国大陆地区宋代文学研究近况定量分析(2002-2003) 贵州社会科学 2005(4)
8 刘 学 宋代文学研究论著近况统计分析 统计与信息论坛 2009 (5)
9 罗凤珠 以语意概念为基础的全宋词研究系统之设计与应用 第五届文学与资讯技术国际研讨会 2005
10 罗凤珠 引信息的“术”入文学的“心”——谈情感计算和语义研究在文史领域的应用 文学遗产 2009 (1)
11 曹立波 用科学的态度和方法探讨红学——“一百二十回本《红楼梦》版本研讨会”综述 红楼梦学刊 2009 (1)
12 曹立波 古籍数字化在古代小说领域的应用 第三届中国古籍数字化国际学术研讨会 2011
13 秦 毅 “唐诗排行榜”式研究不可取 中国文化报 2011-11-02
14 秦 毅 唐诗宋词排行榜比的是什么 中国文化报 2012-02-21
15 尹小林 古籍数字化的使命与应用 中国社会科学院院报 2007-09-18
16 尹小林 古籍数字化应以技术为突破口光明日报 光明日报 2013-05-28
17 王友胜 清人编撰的三部宋诗总集述评 湘潭师学学报(社科版) 1998(4)
18 史 睿 论中国古籍的数字化与人文学术研究 北京图书馆馆刊 1999(2)
19 陈学祖 典故内涵之重新审视与稼轩词用典之量化分析 柳州师专学报 2000(3)
20 朱玉麒 论南宋后期词人的布衣化倾向 北京师范大学学报(人文社科版) 2000(5)
21 沈伯俊 面向新世纪的《三国演义》研究 四川师院学报(哲社版) 2001(6)
22 杨 镰 元诗文献研究 文学遗产 2002(1)
23 费振刚 数码时代的人文研究 南阳师范学院学报(人文社会科学版) 2002(1)
24 付正刚 2000-2001年宋代文学研究论著的定量分析 孝感职业技术学院学报 2002 (3)
25 范肖丹 试论中国诗歌情感造型的量化表现方法 桂林师范高等专科学校学报 2002 (4)
26 周明初 二十五年来明代文学研究的一个样本分析——以人大复印资料《中国古代、近代文学研究》所选印论文的统计为例 南京师范大学文学院学报 2003(1)
27 邱昌员 两宋江西词发展及其贡献的定量分析 南昌大学学报(人文社会科学版) 2003(3)
28 臧克和 上博楚竹书中的“诗论”文献及范型 学术研究 2003 (9)
29 谭秋明 元杂剧宫调、曲牌运用情况的量化研究 广州大学学报(社科版) 2003 (11)
30 陈友冰 李贺鬼神诗的定量分析 文学评论 2004 (1)
31 李奇云 影响范式研究:《周易》与《文心雕龙》 西南民族大学学报(人文社科版) 2004 (1)
32 杨少俊 古代文论与研读手段的现代化——简介《文心雕龙》电脑研究系统 镇江高专学报 2004 (2)
33 沈伯俊 第三届中国古代小说数字化研讨会综述 明清小说研究 2004 (3)
34 李炳海 中国古代文学的定量、定性和定位研究 人文杂志 2004 (4)
35 刘 磊 从历代选本看韩孟诗派之传播与接受 东南大学学报(哲社版) 2005 (2)
36 欧阳健 数字化与《三国演义》版本研究论 东南大学学报(哲社版) 2005 (3)
37 陈文新 数字化时代的中国古代小说研究 东南大学学报(哲社版) 2005 (3)
38 孟 杰 第四届中国古代小说文献与数字化研讨会综述 明清小说研究 2005 (3)
39 刘南南 祁彪佳和吕天成的曲品著作之比较 兰州大学学报 2005(4)
40 郑铁生 《红楼梦》文化研究的定性、定量和定位问题 河南教育学院学报(哲社版) 2005 (4)
41 李 乔 1991-2004年韩愈研究的文献计量学分析 周口师院学报 2005(6)
42 贾鸿雁 中国古代游记的整理与出版 山西师大学报(社科版) 2005(6)
43 鲁 茜 一只鸣髇云外,晓鸿惊——孙光宪词遒劲风格的量化分析 乐山师范学院学报 2005 (7)
44 王乃仁 诗风规则之研究——以唐朝近体诗为例 第五届文学与资讯技术国际研讨会 2005
45 张智星 以电脑音讯技术建置宋词吟唱教学环境的设计与应用 同上 同上
46 郭英德 基于互联网的中国古代文学文献建设现状及发展趋势分析 同上 同上
47 郑锦全 唐诗宋词语义比对 同上 同上
48 张化瑞 “《红楼梦》是否一人之作”的分布均匀度考察 同上 同上
49 胡俊峰 基于概念的唐未诗计算机辅助研究初探 同上 同上
50 李玖蔚 宋代庐陵作家诗词研究论文的定量分析 井冈山学院学报 2006 (1)
51 唐 磊 试论古代文学研究中计量方法的应用 中国社会科学院研究生院学报 2006 (2)
52 李 铎 数据分析时代与古典文学研究的开放性空间——兼就信息化工程与古典文学研究之间的互动问题答质疑者 中国文化研究 2006 (2)
53 赵宽熙 中国古代小说数字化方案探索 洛阳师范学院学报 2006 (3)
54 左洪涛 论《水浒传》主要描写什么样的人 宁波大学学报(人文版) 2006 (6)
55 刘召明 文学数理批评:理论与实践 光明日报 2007-02-03
56 鲁小俊 《中国文学编年史》抽样分析 武汉大学学报(人文版) 2007 (2)
57 孟 彦 第六届中国古代小说文献与数字化国际研讨会综述 明清小说研究 2007 (3)
58 曹 翠 宋人选宋词选本的主题探究——以男女情爱、两性关系的恋情主题为主 阜阳师范学院学报(社会科学版) 2007 (5)
59 编辑部 第一届中国古籍数字化暨第六届中国古代小说数字化国际学术研讨会在北京召开 文史知识 2007 (10)
60 林玫仪 韵律资料库对词学研究之助益 清华大学学报(哲社版) 2007 (6)
61 张 丹 欧阳修词创作主体介入与情感流向定量分析 内蒙师大学报(哲社版) 2007 (S1)
62 何雅茹 晏几道词创作主体介入与情感流向的定量分析 内蒙师大学报(哲社版) 2007 (S1)
63 谢模楷 唐诗称引屈原的定量分析 唐代文学研究(第十三辑) 2008
64 谢桃坊 词谱检论 文学遗产 2008(1)
65 何光涛 元杂剧“楔子”的宫调、曲牌分析 四川戏剧 2008(1)
66 王 刚 唐前山水诗的量化统计分析 宝鸡文理学院学报(社会科学版) 2008(2)
67 黄鸣奋 数字化语境中的我国古典文论 厦门大学学报(哲社版) 2008 (5)
68 刘介民 数字化语境中诗学研究的新视野 广州大学学报(社科版) 2008 (5)
69 何光涛 元杂剧“尾声”运用情况的量化分析 四川戏剧 2008 (5)
70 金 强 吴融诗歌的编选与流播状况分析 理论界 2008 (9)
71 冀运鲁 2004-2006年明清小说研究状况的定量分析 语文学刊 2008 (13)
72 甘 松 女性意识的增长与女性词选的出现——宋、明人选录女性词人的定量分析 合肥师范学院学报 2009 (5)
73 江 瑛 贾岛山水诗定量分析 荆楚理工学院学报 2009 (10)
74 张华林 现存“唐人选唐诗”中的边塞诗定量分析 郑州航空工业管理学院学报(社会科学版) 2009 (6)
75 闻加家 吕天成《曲品》著录的传奇作家地域分布的定量研究 孝感学院学报 2009 (S1)
76 王 丹 古籍数字化与古典文学研究 社科纵横 2010 (2)
77 李明华 新世纪文化学视野下的唐宋词研究——以刘尊明《唐宋词与唐宋文化》为中心 天中学刊 2010 (3)
78 刘双琴 从历代词选看欧阳修词的经典化过程 东华理工大学学报(社会科学版) 2010 (4)
79 吴光正 明清小说的现代整理与数字化 文史知识 2010 (4)
80 张 静 北宋文人对新旧传播方式的态度与选择——兼与当代数字化出版浪潮比较 中州学刊 2010 (6)
81 王 立 第九届中国古代小说文献与数字化研讨会综述 黄山学院学报 2010 (6)
82 张 敏 《诗经》之结构性观察分析:来自心理学的视角 学术论坛 2010 (12)
83 王伟伟 宋代社交词研究(博士学位论文) 山东师范大学 2010
84 方 磊 欧阳修散文经典的传播与接受(硕士学位论文) 福建师范大学 2010
85 史丽香 当前几种代表性中文古籍数字化产品评析——以用户需要和反馈为依据 图书馆工作与研究 2011 (1)
86 杨素萍 1993—2009年国家社会科学基金古代文学立项项目的统计分析 贵州社会科学 2011 (2)
87 冯全功 新世纪《红楼》译学的发展现状及未来展望——基于国内学术期刊的数据分析(2000—2010) 红楼梦学刊 2011 (4)
88 王 宏 试探中国古典文学名著未来出版之路 出版科学 2011 (4)
89 鞠明库 古籍数字化与传统文献学 清华大学学报(哲社版) 2011 (5)
90 周秀荣 唐五代田园诗创作情形之定量分析 社会科学辑刊 2011 (6)
91 黄 纯. 在品评词人中构筑词学理论大厦——对《人间词话》中词人品评的定量分析 北京教育学院学报 2011 (6)
92 连心达 寻根游语,疏凿词源——詹安泰文学批评与“文体分析” 中山大学学报(社科版) 2011 (6)
93 韦楠华 基于文献计量学的中文古籍数字化研究分析 现代情报 2011 (10)
94 李志明 陶渊明文化研究数据库构建与实现 图书馆学研究 2011 (12)
95 苗贵松 中国古典文献数字传播的学科规范与组织困境 第三届中国古籍数字化国际学术研讨会 2011
96 贾继用 古籍数字化背景之下的中国古典文献研究 同上 同上
97 盛 莉 诗情画意的统计分析——谈唐宋诗审美的计算机辅助研究 同上 同上
98 伍慧珠 词学理论研究与资讯科技 同上 同上
99 陈卫星 余象斗评刻本、容与堂本、袁无涯刻本《水浒传》评点比较研究 同上 同上
100 金 星 由《唐诗排行榜》所想到的 中华读书报 2011-11-16
101 傅璇琮 唐诗有了排行榜之后——读《唐诗排行榜》 光明日报 2012-02-05
102 汪 超 《唐诗排行榜》新书发布暨研讨会综述 长江学术 2012 (1)
103 葸 琼 民国时期唐代文学研究的回顾与量化评价 文学界(理论版) 2012 (1)
104 周昌乐 中国古典诗词楹联的计算化研究 心智与计算 2012 (2)
105 陈才智 《唐诗排行榜》平议 中国诗歌研究动态 2012 (2)
106 王 星 苏轼诗词类作品石刻的数量统计与分析 长江学术 2012 (3)
107 张昊苏 定量考察与文学经典——以王兆鹏、郁玉英《宋词经典名篇的定量考察》为例 山东商业职业技术学院学报 2012 (3)
108 余学娟 辛弃疾词对《史记》典故的接受研究 沧州师范学院学报 2012 (4)
109 陈婷婷 20世纪80年代以来我国的明清小说研究现状与期待——基于《明清小说研究》期刊(1985—2010)载文的实证分析 兰州学刊 2012 (4)
110 师海军 20世纪以来明代诗文研究及其趋向——以李梦阳及其相关研究论文的定量分析为考察中心 江西社会科学 2012 (7)
111 祁国宏 唐诗屈骚接受的定量分析与考察 名作欣赏 2012 (14)
112 王伟伟 宋代社交生活的“新宠”——从宋代社交词的定量分析谈起 东岳论丛 2012 (4)
113 唐艳芳 李清照《渔家傲·记梦》英译的美学特征再现——基于定性为主半定量为辅的译作评价方法的探 浙江外国语学院学报 2012 (6)
114 邓 雷 近十年金圣叹《水浒传》评点研究的定量分析 广东技术师范学院学报 2013 (1)
115 李金松 古文唐“瘦”宋“肥”论——以朱东润《中国历代文学作品选》与姚鼐《古文辞类纂》为考察对象 文学与文化 2013 (1)
116 白 寅

试论文学作品历史影响力测度模型的构建——兼与王兆鹏先生商榷“唐诗、宋词排行榜”的计算模型

社会科学 2013 (2)
117 王 敏 近二十年来《儒林外史》翻译研究回顾——基于1994~2012年CNKI相关论文的计量分析 长春理工大学学报(社会科学版) 2013 (4)
118 程毅中 古籍数字化须以古籍整理为基础 光明日报 2013-04-30
119 马建农 古籍数字化的核心是文化内涵 光明日报 2013-06-25

  资料来源:根据中国知网检索数据统计整理

  国家社会科学基金是我国在科学研究领域支持基础研究的主渠道,面向全国,重点资助具有良好研究条件、研究实力的高等院校和科研机构中的研究人员,代表学术研究的国家高度,可看作是中国古典文学数字化进程中量化研究主流认可的国家标志。见表5。

表5 中国古典文学数字与量化研究项目:国家基金

序号 项 目 名 称 负责人 工作单位 项目类别 年度
1 中国文学编年地理研究及信息平台建设 王兆鹏 武汉大学 重大项目 2012
2 中华吟诵的抢救、整理与研究(负责抢救整理) 赵敏俐 首都师范大学 重大项目 2010
3 中国戏曲与互联网传播研究 杨 燕 中国传媒大学 重点项目 2007
4 大型格萨尔文化数字资源库建设及其应用研究 兰却加 西北民族学院 重点项目 2003
5 宋代文学地图数字分析平台研究 刘京臣 中国社会科学院 青年项目 2012
6 宋词经典的生成及嬗变研究 郁玉英 井冈山大学 青年项目 2010
7 20世纪唐五代文学研究论著目录数据库与定量分析 王兆鹏 武汉大学 一般项目 2009
8 唐宋词的女性化特征演进史 孙艳红 吉林师范大学 青年项目 2009
9 唐宋词的定量分析 刘尊明 深圳大学 后期资助 2008

  资料来源:根据全国哲学社会科学规划办公室公告整理

  另外,多届中国古代小说文献与数字化国际研讨会[①]、文学与资讯技术国际研讨会、中国古籍数字化国际学术研讨会等学术盛事,更为古典文学数字化进程中的量化研究提供了展示舞台,意义甚大,数量较多,限于篇幅,前四表略举一二。

  可以看出,上述二百多论文论著多集中在唐宋文学范围,涵盖中国古代文学、中国古典文献学、汉语言文字学、世界文学与比较文学、应用心理学、计算机应用技术等学科,体现出鲜明的不平衡性和交叉性,此为数字化进程中古典文学的量化研究大势。

  二、古典文学定量研究方法的学术争鸣

  近30年来,一场关于研究范式或研究方法的论争几乎波及整个西方世界,我国学者也对此作了研究[②]。古典文学领域概莫能外,王兆鹏、刘尊明较早将融入中国文学批评的传统方法和当代西方科学哲学思维方式的范式批评运用于古典文学,改变传统的模糊性、直观性的感性把握方式为科学化、明晰化的理性阐释,突破了多年来形成的单一研究格局[3]。惯常思维的改变必然伴随着学术争鸣。

  费振刚提醒在利用计算机和网络给人文研究带来便利的同时,应消除可能带来的负面作用[4]。吴夏平认为古籍数字化对现代学术进程具有积极作用,但同时可导致学术异化:一是知识被遮蔽伪化研究论断;二是数字鸿沟拉大区域学术落差;三是技术伪装学问使伪学术加剧[5]。为答质疑者,李铎从信息技术应用于古典文学研究着眼,指出并不是计算机完全取代了人的工作,而是更加拓展了人文学科研究领域的学术空间[6];郑永晓则认为具有前瞻性眼光的学者决不能仅仅满足于把计算机当作检索工具,而要利用其独特的思维方式,在数字化的基础上将古代文学研究提升到一个更高境界[7];尚永亮支持数据是证据的延伸和扩大,建构古代文学专业数据库是学术研究现代化的必然要求[8];刘尊明则以十多年定量分析的尝试和探索,为文史探讨者还原了一个艰难曲折的研究进程[9]。

  尤其是在王兆鹏、邵大为、张静等著《唐诗排行榜》出版后,引发更大的争议,支持和反对者以傅璇琮与秦毅两人为代表。傅璇琮盛赞著作从传播和接受的角度、依诗作影响深度和广度的标准对有唐三百年间的诗歌第一次进行了令人信服的排行,无论在理论拓展还是实践创新方面,都具有开创性意义[10]。秦毅则对研究方式大加批评,对其“选本、互联网页、评点、研究论文、唱和”5个指标的“50%、10%、20%、15%、5%”的权重计算方案提出质疑[11]。相较而言,陈才智更为公允,认为阅读和研究工具的转换,势必引发研究态势的王变[12]。

  为繁荣学术,《社会科学》杂志刊发一组文章,推动讨论深化。张三夕和张世敏指出,由于古代文学研究对象的特殊性,对古代文学研究中理论上可以确定的变量、基本可以确定的变量可以运用计量分析法,但对不可确定的变量则应当避免使用计量分析法[13]。白寅与杨雨则对《唐诗排行榜》和《宋词排行榜》计算模型提出改进建议:确立文献类型重要性的梯度;权重系数不但要设立文献类型系数、文献时代系数,还应当设立单篇文献影响系数[14]。王兆鹏先生亦撰文回应:排行榜是以数据为基础,数据指标的完备与否就成为排行榜的结果是否科学和有公信力的前提条件。文学作品影响力的评价指标,可从作品的典范性、美誉度和传阅度等层面来选择确定。所选数据既要考虑其量差,也要考虑其质差。作家影响力的评价指标除典范性、美誉度和传阅度外,还要加上名篇贡献率。文学排行榜评价指标的权重设置,最理想的状态是客观赋权法和主观赋权法相结合[15]。争鸣有益于学术是肯定的。

  有研究者指出,对于一个信奉“定量研究”的研究者来说,三个步骤不可缺少:第一步,研究数据要能被世界任何合格的研究者所认可。失去这一点,整个研究也就失去其科学性。第二步,依据数据进行分析、总结、概括,并在此基础上去建立假设(或理论);而且要遵循“假设—演绎”的检验逻辑,让这假设接受严格检验。第三步,依据检验后的假设性质去构建一个理论或理论性的结论, [16]。此虽非针对古典文学,但就研究方法而言,可与争鸣双方共勉。

  二十年前古籍无法检索,现在可以随意地检索数千种典籍中的每一个人名和词语,当然在文本处理方面也可以更精密。但我始终相信,仅靠检索猎取文献的做法无法代替第一手地广泛阅读典籍,只有在融会贯通地阅读群籍基础上才能对学术有透彻的认知,钱锺书先生的读书笔记为我们树立了一代学人勤勉读书、独立研究的典范,值得我们长久地学习和体悟。陈尚君先生如是说。

  三、信息时代古典文学研究的三位一体

  信息时代也称计算机时代或者数字时代,是指个人都有能力去自由传递信息,以及实时获取信息的这种特征,表6可为佐证。

表6 近年来我国网民数量变化:2009年6月-2012年12月

报告序次 网民人数 截止年月 报告序次 网民人数 截止年月
第24次 3.38亿 2009.6 第28次 4.85亿 2011.6
第25次 3.84亿 2009.12 第29次 5.13亿 2011.12
第26次 4.20亿 2010.6 第30次 5.38亿 2012.6
第27次 4.57亿 2010.12 第31次 5.64亿 2012.12

  资料来源:根据中国互联网信息中心发布中国互联网络发展状况统计报告数据整理

  定量方法和定性方法的明显不同是数据化和非数据化。乔尔·史密斯(1991)用独特性和类别化描述定性资料和定量资料的区别:

  就细节而言,没有人会争论说事件、群体或人不是独特的。争议点在于,共有的属性是否重要到足以忽略其本身的独特性。真正的问题是,我们能不能做到将其分类。毕竟分类就可以得到许多群组,而群组可以将个案转成数据,并以定量方式进行计算。[17]

  定性研究是在研究者和被研究者的互动关系中,通过深入、细致、长期的体验、调查和分析,对事物获得一个全面深刻的认识;而定量研究则依靠对事物可以量化的部分,进行测量和计算,并对变量之间的相关关系进行分析以达到对事物的把握[18]。定量化常常使我们的观察更加准确,定性资料的意义似乎比定量资料更加丰富。风笑天从研究设计、概念测量、资料分析、结果陈述等不同方面,系统解读和分析了英克尔斯等人的著名研究“从传统人到现代人”中所体现的科学精神[19],对提高古典文学定量研究水平具有借鉴意义。

  我们认为,李炳海教授所提出的三维观照系统:定量研究要以类别划分为基础,这样可以使问题由模糊变得明朗,使已有的正确结论得到进一步证实;定性研究必须兼顾观照对象结构形态和功能效应两个方面,避免一般化的概括;定位研究应以发现原型为宗旨,从创作题材、作品体式等方面切入,坚持文学本位[20],至今仍可为古典文学定量研究者的重要参考。

  四、唐代戴叔伦编年系地信息平台建设

  数字化的古籍应该是经过认真整理的古籍,需要运用目录、版本、校勘和文字、音韵、历史文献等各方面知识进行点校,成为现有最好或较好的版本[21]。武汉大学王兆鹏教授主持的国家社会科学基金重大项目“唐宋文学编年系地信息平台建设”(原名“中国文学编年地理研究及信息平台建设”),试图整合静态分散的文学史料,建立一个数字化地图平台。笔者有幸参与其中,负责几位唐宋时期常州作家作品信息基础数据整理和录入,因加入较晚,这里谈谈对戴叔伦的认识。

  戴叔伦(732-789),字幼公(一作次公),一作名融,字叔伦,润州金坛(今属江苏常州)人。出身隐士家庭,年幼即博闻强记,聪明好学,受业于常州萧颖士。曾任东阳令、容州刺史加御史中丞,是唐代大历、贞元年间的著名诗人和循吏。曾撰《述稿》十卷、《书状》一卷(一作二卷),已佚。唯诗一卷尚存,但已非原貌。明活字本《戴叔伦集》收诗130首,清《全唐诗》卷273、卷274收诗超300。20世纪以来,陈庆年、岑仲勉、傅璇琮、孔英、洪素野、富寿荪、周勋初、蒋寅、陶敏、张斌生、熊飞、段承校、陈钧、王佃启、王乐为、葛晓音等学者对戴叔伦事迹和作品研究做出了学术贡献[③]。

  迄今为止,可确信戴叔伦诗歌184首(编年和不编年)、真伪难辨60首、伪作56首[22]。戴叔伦编年系地信息研究就是整合这些静态分散的文学史料,“坚持严格的技术要求”[23],“保证古籍数字化的质量”[24],主要以年谱或作品编年著作为依据,通过作家基本信息(作家、亲族、门人、同年、同僚、友人)、活动编年(时间地点、科第职官、活动内容、创作缘起、交游身份)、作品系年和人物关系库,创建动态的、具有资料查询、数据统计等功能的数字化地图平台[25],为提升中国古代文学研究的数字化水平贡献一臂之力。

注:

  基金项目:国家社会科学基金重大项目“唐宋文学编年系地信息平台建设”(项目编号:12&ZD154)的阶段性成果。

  作者简介:苗贵松(1969-),山东单县人,文学硕士,常州工学院人文社科学院副教授、教师教学发展中心研究员。

注释:

[①] “中国古代小说文献暨数字化国际研讨会”从2001年以来已经先后举办过11次,即2001、2002、2005、2007、2009、2011年在北京首都师范大学、2004年在韩国首尔详明大学、2006年在日本东京大东文化大学、2008年在澳门大学、2010年在韩国首尔成均馆大学、2012年在台湾嘉义大学;“文学与信息科技国际研讨会”分别为2003年在台湾元智大学暨国立清华大学、2005年在北京大学、2007年在东京学艺大学、2008年在香港城市大学、2010年在亚洲大学; 2007年、2009年、2011年在首都师范大学先后举办了三届“中国古籍数字化国际学术研讨会”。

[②]举其要者:李泽厚《关于批判哲学的批判》(人民出版社1979年版),宋健《社会科学研究的定量方法》(《中国社会科学》1982年第6期),钱学森、刘再复等著《文艺学·美学与现代科学》(中国社会科学出版社1986年版),孟蒙《文艺研究新方法探索中的填充化、游离化倾向》(《天津师大学报》1986年第3期),景天魁主编《现代社会科学基础(定量与定性)》(中国社会科学出版社1994年版),赖金良《什么是社会科学以及社会科学的客观性》(《哲学研究》1996年第6期),林德宏《社会科学:复杂性的科学》(《江苏社会科学》1996年第1期),刘恒健《为人文学科正名》(《学术月刊》1996年第10期),谢林平《实证社会科学与人文社会科学的方法论分歧及其溶合》(《岭南学刊》1997年第1期),毛丹《人文学科与社会科学的分合》(《浙江大学学报(人文社会科学版)》1997年第1期),陈向明《质的研究中的“局内人”与“局外人”》(《社会学研究》1997年第6期),陈平原《数码时代的人文研究》(《学术界》2000年第5期),侯龙龙《质的研究还是新闻采访》(《社会学研究》2001年第1期),风笑天《社会学研究方法:走向规范化与本土化所面临的任务》(《华中师范大学学报(人文社会科学版) 》 2005年第6期),彭玉生《“洋八股”与社会科学规范》(《社会学研究》2010年第2期)。

[③]陈庆年辑《横山草堂丛书》( 民国九年刻本)第一集附《戴叔伦诗校刊记》;岑仲勉《唐人行第录》(中华书局1962年4月版)之《读全唐诗札记》;傅璇琮著《唐代诗人丛考》(中华书局1980年1月版),有《戴叔伦的事迹系年及作品的真伪考辨》一文;孔英《唐代诗人戴叔伦小议》(《延边大学学报(哲学社会科学版) 》1980年第2期);洪素野《戴叔伦<怀李贺>诗质疑》(《学术研究》1980年第6期);蒋寅《戴叔伦研究》(广西师范学院1984届硕士学位论文);蒋寅《戴叔伦卒年质疑——与周本淳先生商兑》(《淮阴师专学报(社会科学版) 》1984年第4期);张斌生《戴叔伦抚州对事及其辨对诗》(《镇江师专学报(社会科学版) 》1985年第4期);蒋寅《戴叔伦任东阳令考——兼谈<唐东阳令戴公去思颂>的新发现》(《广西师范大学学报(哲学社会科学版) 》1986年第4期);富寿荪《读唐诗随笔》(《贵州文史丛刊》1987年第4期);王辉斌《陆文学交游考略》(《天府新论》1988年第3期);傅璇琮校笺《唐才子传校笺》(中华书局1989年3月版)卷五;陶敏《中唐诗人事迹小考——<唐代诗人丛考>补正数则》(《唐代文学研究——中国唐代文学学会第四届学术讨论会论文集》1989年7月);蒋寅《戴叔伦两居江西辨证》(《咸宁师专学报》1991年2期);熊飞《戴叔伦交游考》(《渭南师专学报》1992年2期);熊飞《戴叔伦年谱简编》(《抚州师专学报》1992年第4期/1993年第1期);蒋寅《戴叔伦诗集校注》(上海古籍出版社1993年12月初版/2010年5月再版),《大历诗人研究》(中华书局1995年8月版);周勋初主编《唐人轶事汇编》(上海古籍出版社1995年12版)第二册;段承校《戴叔伦事迹补证》(《陕西师大学报(哲学社会科学版) 》1995年第1期);熊飞《戴叔伦生平考补》(《华中师范大学学报(哲学社会科学版》1995年第2期);许总《论贞元士风与诗风》(《广西师范大学学报(哲学社会科学版) 》1995年第4期);陈钧《戴叔伦是进士吗》(《江苏地方志》1998年第3期);王佃启《戴叔伦若干诗作辨伪补正》(《中国社会科学院研究生院学报》2006年第3期);王乐为《论戴叔伦及其诗》(西北师范大学2006届硕士学位论文);高中坡《戴叔伦诗歌研究》(河北大学2008届硕士学位论文);张强《包佶交游考》(《西南交通大学学报(社会科学版) 》2008年第2期);木斋《论中唐中前期文人词的渐次兴起》(《东南大学学报(哲学社会科学版) 》2009年第5期);赵红爱《论戴叔伦的仕隐与诗歌》(《内蒙古农业大学学报(社会科学版) 》2009年第5期);王乐为《戴叔伦“非进士出身”辨》(《东北农业大学学报(社会科学版) 》2011年第5期);尹廷银《试论柳晟俊的唐诗研究》(上海师范大学2012届硕士学位论文);葛晓音《中晚唐的郡斋诗和“沧洲吏”》(《北京大学学报(哲学社会科学版) 》2013年第1期)。

参考文献:

[1] 张三夕.作家作品研究中的数量分析——唐代诗人总数考实[J].徐州师范学院学报,1984(2):63-67.

[2] 王兆鹏,刘尊明.历史的选择──宋代词人历史地位的定量分析[J].文学遗产,1995,04:47-54.

[3] 王兆鹏.走向规范与科学——浅谈“范式批评”[J].古典文学知识,1994(1):83-87.

[4] 费振刚.数码时代的人文研究[J].南阳师范学院学报(社会科学版),2002(1):65-67.

[5] 吴夏平.古籍数字化与学术异化[J].山西师大学报(社会科学版),2012(5):131-135.

[6] 李铎,王毅.数据分析时代与古典文学研究的开放性空间——兼就信息化工程与古典文学研究之间的互动问题答质疑者[J].中国文化研究,2006(2):96-104.

[7] 郑永晓.古籍数字化与古典文学研究的未来[J].文学遗产,2005(5):130-137+160.

[8] 尚永亮.数据库、计量分析与古代文学研究的现代化进程[J].文学评论,2007(6):187-190.

[9] 刘尊明.中国文学史研究定量分析方法论[J].江西师范大学学报(哲学社会科学版),2010(1):20-23.

[10] 傅璇琮.唐诗有了排行榜之后——读《唐诗排行榜》[N].光明日报,2012-02-05(5).

[11] 秦毅.唐诗宋词排行榜比的是什么[N].中国文化报,2012-02-21(2).

[12] 陈才智.《唐诗排行榜》平议[J].中国诗歌研究动态,2012(2):348-350.

[13] 张三夕,张世敏.古代文学研究中计量分析的应用与限度——由唐诗宋词排行榜引起的思考[J].社会科学,2013(2):172-177.

[14] 白寅,杨雨.试论文学作品历史影响力测度模型的构建——兼与王兆鹏先生商榷“唐诗、宋词排行榜”的计算模型[J].社会科学,2013(2):178-187.

[15] 王兆鹏.谈文学排行榜的评价指标与权重设置——以唐诗宋词为中心[J].社会科学,2013(2):164-171.

[16] 沃野.关于社会科学定量、定性研究的三个相关问题[J].学术研究,2005(4):41-47.

[17] (美)巴比(Babbie,E.)著,邱泽奇译.社会研究方法(上册)[M].北京:华夏出版社,2000:50.

[18] 陈向明.社会科学中的定性研究方法[J].中国社会科学,1996(6):93-102.

[19] 风笑天.英克尔斯“现代人研究”的方法论启示[J].中国社会科学,2004(1):66-77+206.

[20] 李炳海.中国古代文学的定量、定性和定位研究[J].人文杂志,2004(4):103-108.

[21] 程毅中.古籍数字化须以古籍整理为基础[N].光明日报,2013-04-30(6).

[22] (唐)戴叔伦著,蒋寅校注.戴叔伦诗集校注[M].上海:上海古籍出版社,2010:10.

[23] 尹小林.古籍数字化应以技术为突破口──兼与程毅中先生商榷[N].光明日报,2013-05-28(13).

[24] 马建农.古籍数字化的核心是文化内涵[N].光明日报,2013-06-25(13).

[25] 王兆鹏.建设中国文学数字化地图平台的构想[J].文学遗产,2012(2):131-133.

  

Comments are closed.