历史与AI的距离|用人工智能辅助史学训练:一个高校教师的经验

2024-04-14 星期日

白珊珊(四川大学历史文化学院)

作为世界古代史的学习者,我曾在2017年协助人工智能专业的室友完成相关问卷调查,她当时戏称我们俩的学科方向可能隔着“世界上最遥远的距离”,没想到七年后的今天我居然会讨论如何联系这两个看似遥远的方向。“对于历史学家来说,AI既是挑战又是机遇。一方面,AI的发展可能会改变历史学家的研究方式和角度,挑战其传统的研究方法。例如,AI可以自动化文本分析和数据挖掘,加快处理大量历史资料的速度和效率,但这也可能导致历史学家失去深入了解历史的机会。另一方面,AI可以为历史学家提供更多的数据和信息,帮助他们从全新的视野中解析历史。同时,AI也可以产生新的研究问题和方法,提供更多的思考角度和工具。因此,历史学家需要具备跟上时代的观念和技能,积极应用AI技术,从而更好地认识历史。”正如AI给出的答案所言,人工智能的学习能力、搜索能力和总结能力不断提升,我们可以如何利用它来推进史学训练?笔者并非技术能手,作为文科工作者也没有付费使用AI,因此只够提供一些简单容易上手的操作经验,希望能惠及不愿付费的同行们。我结合世界古代史的教学经验,从图像、语言、资讯、写作、检索等多方面介绍如何利用AI来辅助史学训练。

一、从翻译作业到译注与校对

随着有道翻译、DeepL等翻译软件的出现,许多学生在翻译作业中依赖翻译软件。尽管老师们在课堂上强调不要使用AI来完成作业,但显然无法完全控制学生的行为。有的老师选择直接给出错的译文,让学生完成校对工作。与此同时,不少专业出版社已经开始建议译者借助GPT等AI来打磨自己的译文。在古代经典翻译研讨中,我已遇到多位学者在国际学术报告中采用AI的译文,并在其基础上进行修订。基于这样的现实情况,我倾向于转变作业内容和训练模式来应对新的时代处境和挑战,但这显然并不等于放弃传统的史学训练和语言学习,而是利用AI辅助训练。

现代语言的翻译训练传统由来已久,许多外国研究相关的课程都会涉及翻译与校对的练习。在世界古代史和古希腊罗马史专题课程中,我要求学生在课堂上现场直译英文,在课后则完成校对和译注作业而非单一的翻译作业,即直接校对AI翻译软件的结果,并通过检索为文本中的专业术语提供注释。在个人完成初步的校对和译注之后,再由团队成员合作互相校对,模拟出版社的三审三校流程,也希望能让学生尽早对做书的实际工作流程稍有体会。

学生们比较几个软件英译中的结果发现,GPT英译中的质量并不可观,而DeepL虽然对句法还原较为准确,但存在1500字符限制且无法反馈错误。有道翻译对国内用户显然更友好,但在句法准确性上稍有逊色。苹果系统自带的拍照、文字识别和翻译功能则存在段落零散切分、语境割裂、无法修正和反馈术语等问题。

经过一学期的训练,我和学生一起简要总结了校对与译注训练的情况:

一、最基础的校对工作在于疏通句子的中文表述,统一专业词汇的翻译方法,这仅要求学生仔细通读英文和中译文,即可完成修正,对能力和知识水平要求不高。

二、较难的校对工作要求学生对古代研究的术语有所掌握,才能准确更正AI翻译。例如Senate一词在罗马史的语境中意为元老院而非参议院。Assembly在古希腊史的语境中意为公民大会而非议会。在课堂讲授之外,术语译注很大程度上可以通过勤奋查阅权威专业的百科词条和工具书来进行修正。对于这类术语,通过反馈功能提出意见,也能为后续使用AI翻译节省时间。不过,目前不少国外的翻译软件无法反馈中文译文的问题。

三、英语句法的问题,在学生拿不准英文句法的时候,也可以通过对比多个翻译软件的结果,结合上下文推测句子的意思来进行修正。

四、表述的精确性和细微差异。许多学生甚至译者对于学术表达的精确性缺乏深刻的理解和体会,导致译文假滑(看上去中文顺畅,但实际遗漏了许多重要的定性表述)。例如学生在翻译logographer、speaker、orator等词汇时,由于不熟悉古希腊演说方面的历史背景和专业术语的内涵,无法区分三者的区别,统一翻译为演说家。另外,还出现了学生对20岁以前不同年龄段的古希腊罗马人不加以区分,统一翻译为青年的情况。

五、在整理二手文献的训练中,我要求学生进行文献检索与摘要翻译。在英语文献之外,部分同学也积极主动搜索法、德、意、西、俄语文献,但这类语言转译成中文的质量远远不如英译中。因此,把篇幅较短的法、德、意、西语摘要转译为英语更为可行。

这种训练模式一方面能培养起部分同学勤奋查阅专业的工具书来解决术语问题的好习惯,同时也可能纵容学生依赖翻译软件的惰性,在通过英语四六级后懒于学习语言。因此,我要求学生在提交作业时在文档中标记出自己校对的痕迹,同时要求团队成员以文档批注的形式来互相校读,进一步修改和提升译文质量。这一过程也有助于帮他们了解图书编辑和出版的工作流程,同时学会接纳同行的意见。

至于古典语言的学习与翻译,拉丁语课的学生在查阅单词时利用AI能够快速获取词汇信息。AI虽然已经积累了不少古希腊拉丁经典作品的英文翻译,但对句法的分析和词汇的掌握仍较为有限。如果给GPT3.5一段著名作品的古希腊语原文,并索要英译文和词汇表,GPT提供的词汇表含义可能仅仅为词条中最常见的条目,未必贴合语境。今年利物浦古典学邮件社群([email protected])也对训练AI直译古典语言展开了激烈的讨论,一位非古典学第一专业的年轻人在社群中请求学者给出自己的字面翻译,来支持对AI的古代语言训练。有学者激烈地指责这一行为会影响自己的饭碗。有学者回应中老年学者无论如何都应该对年轻人报以宽容。部分学者认为所谓的逐词对应直译丢失了古典语言的美感,且缺乏可读性。古典文学文本的翻译之外,GPT翻译简单且不残缺的古希腊、拉丁铭文倒不在话下,简单的方言和正字法的识别也不够成问题,只是专业术语的选取仍然存在问题。

近年来,由DeepMind、谷歌、牛津大学等多家研究机构联合开发的Ithaca——复原古希腊铭文的工具在网络上引起热议。GPT认为,“人工智能促进了跨学科合作的发展,历史学家可以与计算机科学家、数据科学家和其他领域的专家合作,共同探索历史数据和文献,发现新的研究方法和技术,从而促使他们审视自我和他们的研究方法。”虽然Ithaca的数据库材料有限,复原准确度存在诸多问题,但这也不失为一份辅助和参考的工具,数据库的记忆容量和分析匹配速度可能算是一点优势。

我相信不久的将来,随着反馈机制的完善与翻译准确性的提高,各种工具翻译语言风格的学术性也会有所改善,史学理论和专业术语较多的论文翻译也会更可靠。越来越多的学术会议中会使用AI提供的译文,多语言国际会议给听众带来的交流困难与难度也会越来越少。

二、输入与输出:作为对话者的AI

在学生吸收知识方面,如何高效阅读二手文献、提升专业讲座听讲效果、对学术资讯进行分类解析都可以借助AI提升工作效率。在知识转化与输出方面,初阶学习者也可以借助AI来完成讲座纪要整理、论文写作构思和格式修订。

在文本与图像的互动方面,我们要求学生根据史家的文字描述来绘制古代地图和皇帝形象,这一方面能够培养学生的历史空间感,另一方面也能让学生通过绘图来深刻体会史料的差异和文字无法提供的“实物感”。目前不少AI图像生成工具用于辅助复原3D古代城市和皇帝人像,为我们直观地感受遥远的古代社会提供了借鉴意义和价值。GPT对此声称,“人工智能可以用于开发各种可视化工具,帮助历史学家将复杂的历史数据和模式可视化呈现。通过这些可视化工具,历史学家可以更直观地理解历史事件的发展和影响,并从中获得新的洞见和认识。”

AI生成的图像虽存在一些问题,但也可以用于史料批判训练。例如请学生组队评价下图中对皇帝形象复原不准确的地方。学生可以通过自主检索关于皇帝面貌的历史文献,对比钱币数据库中的皇帝形象和雕塑形象来完成这项史料批判训练。

AI还可以用于学术讲座的准备与纪要整理。目前学生参与的学术讲座大体可分为讲授性质的科普讲座和研讨性质的学术讲座。针对这两类讲座,学生都应当提前补充基础知识,最大限度地从一场讲座中受益。即便是授课性质的科普讲座,学生也可能无法跟上讲者的思路,为了将学术讲座的效果最大化,增进学术交流,提前花时间准备十分必要。

对于准备专业讲座,我建议学生把听讲的过程变成一次思想的对话。在讲座前初步了解讲者的学术背景,针对讲座题目先给出自己的解题框架,了解历史问题的时代背景与空间环境,在此基础上进一步参考AI和讲座专家的解题思路,思考解答差异的原因及改进方法。基本方法为围绕着柳立言先生提出的“五鬼搬运”(when、where、who、what、why)时间、地点、人物、事实、原因,加上如何、怎么样(How),构成的“史学六问”。例如,解构梭伦改革、埃赫那吞改革等历史事件,学生能够围绕着改革的定年与时代背景、改革地点与当地社会环境、改革者与改革受众、改革内容与措施、改革原因与历史语境、改革方式和如何评价等角度来整理史料与二手文献。AI的答案能对学生的思考框架进行补充和完善,当然也存在不适用之处需要剔除。

例如在举办希罗多德的讲座之前,我建议学生提前阅读希罗多德的《历史》中译本开篇,并参考AI提供的讲座准备指南去思考文本的问题:希罗多德生平概况,《历史》的内容和结构,希罗多德的写作风格,希罗多德的历史方法(他对历史研究的方法和态度、对他所研究时期的见解和观点),历史背景(希罗多德生活时期的历史背景、他所处时代的社会、政治、文化特点),希罗多德的历史价值(《历史》在古代和现代的影响、对后来历史学的贡献),关键主题和事件,历史真实性和批评(希罗多德史学的真实性和可靠性、后来学者对他历史作品的批评和评价),与其他历史学家的比较,文学和修辞分析。不过,AI显然不如历史学家对语境(context)那么敏感,也不如研究者对问题的讨论那么具体(concrete)。当我将问题换成修昔底德时,AI的答案与希罗多德的问题基本一致,仅增加了“战争与道德”这一维度。

讲座结束后整理讲座纪要的过程中,我鼓励学生积极运用AI语音转文字,在线AI自动校对和整理功能,先做出一篇讲座纪要草稿,在此基础上根据讲座录音进行人工校对。如此一来,能够更迅速地生成一份详实完整的讲座纪要,这也对知识的传播更加有益。

不过,这对于英文讲座纪要整理难度更大,初学者在听讲和校对讲座纪要过程中也很难识别一些专业术语。我们尽可能争取英文教授提前将ppt发给学生准备,熟悉老师初步翻译过的专业术语,以便提高学生听讲质量。

在研究性质的学术讲座和进行论文写作之前,我建议学生先熟悉不同研究方向的重要研究路径及研究话题。例如,在奴隶制相关的讲座开始前了解古希腊罗马奴隶制的重点研究问题、古代奴隶的不同术语、重要学术论争(奴隶是否作为一种社会财产存在)等基础内容。我们常常跟学生强调问题意识,但他们对于这一概念可谓熟悉又模糊,而这种训练方式有助于培养学生把握问题、搭建知识体系的能力。在这一准备过程中,学生可以通过检索Oxford Bibliography、Brill's New Pauly等较为基础的数据库,将检索结果提交给AI初步整理,迅速了解讲座内容在学术史上的粗略位置。

在这方面,KIMI微信小程序给出的答案不尽如人意。KIMI检索的信息相对于GPT而言较为有限,但KIMI的优势在于,回答问题之前会给出检索的文献资源及链接,方便使用者复制链接去阅读,也降低了胡编乱造的概率。但其劣势在于,KIMI无法区分学术史中的重要论证和研究问题,不仅如此,在为KIMI提供参考答案之后,即使重新对其提问,KIMI无法像GPT那样迅速修正答案。因此,专业数据库和AI的联合应用十分必要。

在论文写作与历史学专业英语训练过程中,已有不少学生将自己的论文题目发给AI,并参考其答案来完善自己的思路框架。我以古代斯巴达妇女运动为题,要求AI给出大纲,AI的答案如下:

由此可见,缺乏对史料了解的AI给出的论文大纲比较空泛,但这也是一个可以用于讨论该类型问题的宏大框架。因此,在史学训练的过程中,我们更应不断提醒学生将他们的表述和思考更加具体化和语境化(contextualize),这也就要求学生更多回到史料,进行史料批判。许多学生在学习之初不知道如何进行批判性思考,误以为批判性思考就是提出批评意见。实则不然,初阶训练中,最简单的批判性思考便是回归历史语境。

在对话者之外,AI无疑也是一位小帮手,能够帮助我们修订外语学术写作和文献格式。对于初学者来说,运用Grammarly和GPT初步修改英文写作,通过对比AI的修正结果,在此基础上进一步查字典和寻求教师指导的帮助,帮忙甄别哪些AI修改的表述可以保留,哪些不宜采纳。不过,这类软件能为高阶研究者提供的文字润色目前还较为有限,英语母语者人工润色仍无法被免费AI取代。

AI为研究者带来的最大便利之一莫过于修改参考文献格式,过去基于noteexpress、Zotero和Endnote等工具生成的参考文献格式与Office或WPS论文写作软件的联动并不总是令人满意,在改投论文时,我们可能仍需手动逐一调整论文格式。如今,直接交给AI一个范例格式和参考文献清单就能省去不少麻烦。AI能自动将文献清单按照所给范例格式重新整理,这为投稿修改格式节省了许多时间。即使如此,在教学过程中,我仍然借鉴了莱顿大学政治学系学术写作课的训练模式,要求学生手动修改并统一学术论文的格式,让他们亲自体会格式规范的重要性。

▲未整理的参考文献和AI整理后自动排序、斜体的参考文献

三、史学前沿资讯整理与知识体系的搭建

在获取和整理前沿资讯方面,我所接触的本科大一新生主要从老师推荐的微信公众号平台获取学术资讯。对许多博士生而言,尽管他们会订阅各种国外专业的史学平台邮件,获取最新学界信息,但对于信息的利用率和知识转化率却相对较低。对于每天接收高达几十封来自出版社、学术网站和学界邮件的史学学习者而言,AI无疑可以为我们迅速整理邮件内容并对其分类提供重要帮助。

人工初步筛选出新书资讯、会议征稿(CFP)等不同类别的信息,训练AI将每日收到各类的邮件内容整理分类。例如对会议征稿的解读,这类资讯通常会包括少许史料和参考书目、论及学术史的转向、重要的理论或经典文献、重点研究问题,同时也能帮助我们初步了解国外研究机构的研究风格与取向。我要求GPT按照研究机构、史料、学术史、研究问题和参考书目等提示词来整理会议征稿通知,案例如下:

由此可见,尽管中译文不尽如人意,AI能够帮助学生迅速翻译并提取学术史、学术问题、参考文献等内容,并将其纳入以研究路径为基础划分出的政治史/经济史/社会史/文化史/宗教史等文档中、或以史料时间或类型为基础划分出的古风时期/古典时期/希腊化时期文档中。在整理和积累学术资讯的过程中,学生对于史学研究路径与史学前沿的把握也将更加完善。

需要指出的是,利用AI整理资料的一个技术困难在于,不同程序之间的联动程度有所不同,许多免费AI无法点击网页链接,而必须人工复制网页内容到AI聊天框。这背后也涉及信息引流、网站点击和数据付费的问题,不知未来AI还会如何影响互联网生态与学术工具的开放性。

结语

我显然不希望学生借助AI而放弃思考、放弃磨练语言,而是希望他们能借此提升工作效率和信息处理能力,将一些琐碎细小的信息利用到极致,更高效地整合信息来搭建知识框架。AI可以提供一个参考对照组,也可以成为思路框架的对话者。在和学生的沟通中,我也时常强调,使用AI提高工作效率绝不等于放弃学习外语、熟悉格式规范、自主思考问题。诚然,AI不能代替我们的语言技能与分析思考能力,但在翻译、搜集、整理和分析资料等方面,都可以为史学训练提供便捷,为修改文献格式节约时间。

许多学者可能笃信有生之年AI很难让历史学家失业,但我相信AI的学习速度不容小觑。目前免费AI尚且缺乏诸多史学能力。例如不熟悉认识现代历史学正在议论的问题和主题、历史语境感和表述的精确性不足、缺乏历史学家的专业术语、不完全掌握检索图书目录、古文书资料、电子图书杂志等情报工具的知识和能力、不完全具备运用阅读特定时代档案文件的必要方法和技能,如古文书学、碑文研究等、不完全具备清晰地梳理复杂的历史信息的能力。而这些AI尚且欠缺的能力更是我们作为史学专业学习者需要注重的,尤其是少用空话套话,表述得具体(concrete),在思考问题时更注重历史语境(context)。

当然,我个人对免费AI的发展也有少许期待,例如实现AI与更多软件和数据库的免费联动、多语种交叉翻译质量的提升、完善中文专业术语的反馈机制、专业表述风格的进一步改进、生成图像时减少对素材数量的限制、提供更多元化且具有针对性的参考答案。

未来翻译行业对AI的运用可能更广泛,专业学者或许会更多参与图书出版的校对工作而非翻译本身,而校对能力的培养可能会越发重要。随着AI在国际会议中的应用不断加强,一些学生对于学习第二、第三外语的方式和应用场景可能会发生转变。国际视野中的历史学无疑是持续反思和开放的学科,史学理论对人工智能的讨论也越来越热烈,历史教学和学术会议也不乏对人工智能的应用。AI的不断更新与完善促使我们重新审视自己的学科和学术训练,以适应未来的发展趋势。我也期待更多学友来探讨AI在历史教学与研究中的应用,吸引文科“穷人”出钱升级付费AI。


本文首发于《澎湃新闻·私家历史》。欢迎点击下载“澎湃新闻”app订阅。点击左下方“阅读原文”即可访问全文。

投稿邮箱:[email protected]

原文地址:点击