材料一:
①数字人文是采用数字技术来解决人文领域研究问题的新型学科。中国古代文学研究目前至少存在着资料离散和时空分离两大难题,不借助数字人文技术就较难突破和解决。
②文献资料的离散,有“同类异处”和“异类分隔”两种状态。“同类异处”是指同一专题、同一领域、同一学科的材料,往往分散在不同的文献里。“异类分隔”是知识分类造成的资料分离。由于人类知识的广泛性、辛富性和复杂性,不同性质、不同领域的文献资料总是分门别类收藏和存储。比如,书写梅花的文学作品,收藏在文学领域的总集、别集里,而介绍梅花生物特性、栽培技术的知识,则在植物学著作里。无论是“同类异处”还是“异类分隔”的文献资料,人力都难以改变其离散状态。
③古代文学研究的时空分离,体现在两个层面。在观念意识层面,是时间意识强烈,而空间意识淡薄。文学史研究,注重时间的变化进程,而忽视空间的离合分布;时间进程的描述多,作家活动、作品创作的地理空间分布的考察相对少。作家年谱、别集编年笺注和文学编年史之类的著作,注重时间编年而不注重空间系地,时间信息具体而空间信息模糊,时间感强而空间感弱。
④在实践操作层面,受思维方式和纸本载体功能的限制,文学史和文学编年史的呈现,只能是单向呈现,而不能多向呈现。按照时间序列呈现文学史的发展历程,就难以兼顾空间序列的分布和变化。如果按照空间序列来呈现各地文学图景,又难以从时间序列上观察和呈现一代文学的发展进程。简言之,以时间为轴心,空间秩序就被割裂;以空间为轴心,时间的序列就被打断。比如我们从《杜甫年谱》知道,天宝十三年杜甫在长安,过着“朝扣富几门,暮随肥马尘”的窘迫生活,但我们无法知道,这一年李白在哪里,岑参在哪里,高适在哪里。《苏轼年谱》可以告诉我们苏轼一生到过杭州、密州、黄州、儋州等地,但不能告诉我们,在苏轼生前和身后,还有哪些作家到过这些地方,写有什么作品。
⑤怎样运用数字人文技术解决资料离散和时空分离这两大难题呢?以运用数字人文技术开发的唐宋文学编年地图平台为例,它旨在囊括历年来有关唐宋作家作品编年的成果信息,包括年谱、别集笺注、考订论文等。要让计算机能够识别处理这些编年文献资料,并在地图中可视化呈现,需要经过数据建模、数据转化、数据关联和呈现三个阶段。
⑥数据建模,是为数据挖掘、信息提取建立模板。而建立什么样的模板,取决于平台的要素和功能。唐宋文学编年地图平台包含时间、地点、人物、事件、作品这五大要素,需要实现浏览检索、关联生成、数据统计、时空定位和可视化呈现这五大功能。不同要素只有形成一定的结构之后才能产生功能,因而需要围绕时、地、人、事、文这五大要素来设计数据模板。
⑦数据转化,是根据数据模板,挖掘提取文献资料中的时间、地点、人物、事件和作品等有效信息,转化为计算机系统可以识别、关联和统计的数据。
⑧数据关联及呈现,是将各类数据进行融合,开发成关系型结构化数据库。作家作品的数据通过编年和系地两个属性,可形成关联数据。借功GIS(地理信息系统)地图技术及软件编程技术;将数据融合成一体。数据关联融合后,文学编年地图平台就能可视化呈现作家行迹。既可以呈现一时一地一个作家一生的行迹,也可以展现不同时间多个地方多位作家的活动行迹。时空一体,在这里得到初步实现。
(摘编自王兆鹏、邵大为《数字人文在古代文学研究中的初步实践及学术意义》)
材料二:
段海蓉:数字人文给科研工作者带来研究便利的同时,可能带来哪些问题?
郑永晓:比如相关论文中各种数据、图表的泛化现象,用“检索代替研究”“技术伪装学问”等就是突出的问题。此外,还涉及研究成果中文献利用或者说引用的规范性、版权问题等。古代文学研究,需要我们研究者与古代作家建立心灵的对话,需要对作品有良好的感悟能力,才能对古代文学现象作出有深度的阐发。前《文学遗产》主编陶文鹏先生就对满篇都是通过检索罗列的各种文献,而没有思想、没有艺术分析的论文很不满,斥之为“电脑体”,我对此很赞同。
我们提倡关注数字人文研究,不能只有数字而没有人文,归根到底它应该还是人文研究,需要保持人文研究的根本属性和基本特点。技术和数据驱动是为了让我们的研究建立在更坚实的科学依据之上,是为了让我们的学术观点更具有说服力,也是为了让人文研究在新时期焕发出新的生命力。
段海蓉:我们是否应该担心数字人文会对人文精神造成戕害?
郑永晓:这种担心有一定道理,关键是如何趋利避害。数字人文的目的是通过新的方法去解决一些传统方法不能解决或解决不好的问题,并非要完全取代传统人文研究,也不可能完全取代传统研究。如果运用得当,数字人文应能够促进人文精神的弘扬而不是阻碍、妨害人文精神。以最具个性化的也是最具人文特点的文学作品鉴赏为例,我们借由作品与古代作家进行的心灵对话,似乎与冷冰冰的计算机毫无关系,但是有计算机的帮助效果可能不一样。比如我们读纳兰性德的“片帆何处,南浦沉香雨”,稍有文学常识的人会联想到屈原的“送美人兮南浦”,白居易的“南浦凄凄别”等。但计算机可能做得更多,它会把与“南浦”相近似的“灞桥”“长亭”等聚在一起,分析这些表达离别的意象的相似、相异之处,统计它们被历代作家使用次数的多寡,并将这些信息共同呈现给读者。有了数字人文的帮助,读者对文学作品的理解会更为深入,而不是相反。
我以为,避免数字人文产生弊端的最有效办法是学者必须具备深厚的人文学术修养。只有在具备深厚人文修养、精通传统人文学科的研究体系和研究方法的基础上,同时深入了解计算机科学的特点和数字人文的长处,从问题出发,将传统人文科学方法与数字人文有效整合,才能将二者的优势结合起来,趋利避害,在学术上开辟出新的天地。
(摘编自《古籍数字化、数字人文与古代文学研究——访中国社会科学院郑永晓教授》)