
亚太人文与艺术
Asia-Pacific Humanities and Arts
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3629(P)
- ISSN:3079-9554(O)
- 期刊分类:文学艺术
- 出版周期:月刊
- 投稿量:0
- 浏览量:326
相关文章
暂无数据
《西域考古历史论集》的术语翻译与管理研究
Terminology Management in Translating Collected Essays on the History and Archaeology of the Western Regions
引言
近几年随着人工智能和大语言模型的不断发展,术语管理的工具不断涌现,关注度不断增强。在术语库构建方面,已有研究借助计算机辅助工具,比如 SDL Multiterm、Antcoc 等,以提高术语库建设的效率。如康宁等(2015)从计算机辅助技术角度探讨术语库的创建与应用,华道阳与胡妮(2024)利用 SDL Multiterm 实现航空科技术语的规范化管理。同时,部分学者尝试结合大语言模型,如 ChatGPT、DeepSeek 以及 Kimi 等来进行术语翻译和质检,以提升专业性和准确性。冯志伟(2024)以 ChatGPT 为例探讨了大语言模型为术语翻译带来的机遇。
尽管数智化为术语库建设带来诸多可能,当前国内术语管理研究仍相对薄弱,领域较为单一,多集中于术语翻译,术语提取研究较少,考古专业术语则更为缺乏。考古术语涉及历史、地理、天文等多个学科,专业性强、构建难度较大,需跨领域知识支持。目前国内代表性术语库包括“术语在线”“中国特色话语对外翻译标准化术语库”“中华思想文化术语库”等,但尚无专门的新疆考古术语库。虽已有学者提出相关设想,如吴丽环(2023)借助 memoQ 和 QTerm 处理考古术语,然而结合大语言模型的术语库实践仍属空白,考古术语查询仍主要依赖《中国考古学大辞典》以及《汉英文物考古词汇》等工具书。
本文主要以王炳华《西域考古历史论集》(2008)为语料,进行术语库建设,主要设计思路如下:第一步,借助 Sketch Engine 创建目标语料库并提取术语,依据考古学标准进行人工二次筛选;第二步,通过云译客“任度通用”引擎预翻译术语,并利用其大语言模型进行术语质检;第三步,将完整的术语表导入云译客,完成术语库的存储和维护等。全过程融合智能辅助工具与人工监督,以保障术语的专业性与准确性。
一、基于《西域考古历史论集》术语库构建的案例解析
(一)提取术语
Sketch Engine 是英国公司开发的一款在线语料库工具,目前已广泛应用于语言学研究中,主要用于同近义词的分析、结合语境分析以及词典编撰等;在英语教学中主要用于词汇教学;在翻译研究领域可用于译文对比分析以及译者行为研究等。本文主要使用 SkE 工具创建语料库,并结合其中的中文语料库 Chinese Web 2017 (zhTenTen17) Simplified 为对比语料库进行术语提取,该语料库目前包含数百亿词例(tokens),语料内容来源广泛,语言特点明显。
《西域考古历史论集》全书共79万字,46个章节,将《西域考古历史论集》按照章节进行术语提取,“SkE 可允许用户使用用户选择的统计数据并将结果基于原始频率或 ARF(平均降低频率)来为任何子语料库提供与完整语料库相关或与另一个子语料库相关的关键词列表。”(Rychlý et al., 2007) 为保证术语的专业性,将关键分(Keyness Score)300 以上、频次(Frequency)5 以上的术语定义为术语,其中关键分(Keyness Score)通过比较目标语料库和参考语料库中的词语频率差异得出,分数越高,专业特性明显,则更有可能是该专业的术语。
| Item | Frequency (focus) | Frequency (reference) | Relative frequency (focus) | Relative frequency (reference) | Score | |
|---|---|---|---|---|---|---|
| 金银器 | 27 | 337 | 4508.26514 | 0.02031 | 4419.507 | |
| 突厥 | 26 | 18931 | 4341.29248 | 1.14089 | 2028.262 | |
| 西突厥 | 13 | 1510 | 2170.64624 | 0.091 | 1990.507 | |
| 纹锦 | 10 | 144 | 1669.72778 | 0.00898 | 1656.353 | |
| 富昌 | 5 | 645 | 834.86389 | 0.03887 | 804.588 | |
| 联珠 | 5 | 677 | 834.86389 | 0.0408 | 803.698 | |
| 金器 | 5 | 4313 | 834.86389 | 0.25993 | 663.423 | |
| 墓葬 | 13 | 42390 | 2170.64624 | 2.55467 | 610.928 | |
| 考古 | 31 | 162782 | 5176.15625 | 9.81019 | 478.914 | |
| 月氏 | 3 | 2599 | 500.91837 | 0.15663 | 453.949 | |
| 瑞兽 | 3 | 5132 | 500.91837 | 0.30928 | 383.353 | |
| 铁镂 | 2 | 51 | 333.94556 | 0.00307 | 333.919 | |
| 器饰 | 2 | 51 | 333.94556 | 0.00307 | 333.919 | |
| 突厥族 | 2 | 253 | 333.94556 | 0.01525 | 329.915 | |
| 宝相花 | 2 | 402 | 333.94556 | 0.02423 | 327.023 | |
| 土物 | 2 | 489 | 333.94556 | 0.02947 | 325.357 | |
| 陶瓶 | 2 | 537 | 333.94556 | 0.03236 | 324.446 | |
| 葬俗 | 2 | 1099 | 333.94556 | 0.06623 | 314.139 | |
| 珠绣 | 2 | 1251 | 333.94556 | 0.07539 | 311.464 | |
| 西域 | 8 | 54688 | 1335.78223 | 3.29582 | 311.182 |
为保证提取术语的完整性,在 SkE 提取后的术语需要人工对其进行二次筛选,可借助 SkE 的另一个功能,即索引功能(Concordance)来结合术语出现的具体语境进行二次核实,专业性则更加明显。“Sketch Engine 提供了许多进一步探索索引的方法,包括排序、过滤、频率报告和搭配报告,最近的增加包括在两种语言中同时查询。”(Kilgarriff, 2013) 通过索引的方式,也有利于了解原术语的具体语境,在翻译时,也有利于针对这种术语进行深入的阐释。这个功能主要是针对专业性较强的一些术语,如回鹘、宝相花、璜等,以宝相花为例,在 SkE 的索引中检索出来的结果为图1所示,结合文中针对该术语的具体解释,可知宝相花可能为我国出土的一种古代文物,因此对于这类术语属于考古学中的遗物名称,因此可以将该词定义为考古学术语。
(二)云译客翻译+质检
针对提取后的术语,主要使用云译客进行机器预翻译,“云译客目前为传神公司推出的一款一站式智能翻译平台,不同于传统的机器翻译引擎,云译客配备专属定制的私有化引擎,可利用大数据和 NLP 技术,通过真人语料训练机翻引擎,来提升机翻翻译质量。”(佚名,2018)在翻译过程中可进行私人化定制,选择相对来说翻译质量较高的机器翻译,在该项目中使用的主要是云译客自带的机器预翻译引擎“任度通用”。
机器预翻译能够有效减轻翻译量和翻译负担,但是不排除计算机翻译过程中存在一些常见问题:一是单词拼写错误、单复数错误等;二是语义不一致,未能将原文含义明确表达;三是音译与直译混用,导致读者无法捕捉真实信息与含义;四是在文化背景信息不明的情况下进行字面翻译,未结合上下文语境与文化背景,从而导致翻译错误。
通过云译客自身的质检(QA 检查)功能可对术语翻译中存在的基础错误进行改进,但质检后的术语仍可能存在一些问题,此时需人工借助大语言模型进行干预。对于机器翻译后的术语人工质检主要分为两种情况:已规范术语与未规范术语。
1. 已规范术语
针对已规范术语,译者的翻译任务量相对较小,工作重点在术语查询上,需要译者借助现有语料库和相关书籍确定最终译名。对于已规范化术语,人工可在现存语料库(如术语在线、中国大百科全书、大英大百科全书)中进行核实,例如“大月氏”一词云译客给出的译法是“DaYue’s”,存在明显误译;在术语在线中检索后的译名为“Da Rou Zhi; Great Rou Zhi Tribe; Avars”等,从而使翻译更加标准。“联珠”在机器翻译为“Joint bead”,而中国大百科全书中给出的翻译“linked beads”则更恰当。
2. 未规范术语
最新出土的文物常面临译名不规范的问题,例如“五行出东方利中国”锦护膊、尼雅遗址、精绝古国等遗物或遗址的译名尚未完全规范统一,这影响中国考古学对外传播。考古术语库的建立有助于规范翻译过程中的术语统一与标准化,减轻译者负担并提升中国考古学在国际学术界的话语权。
对于未规范术语,需在充分理解文化背景后进行翻译。云译客可连接不同类型的大语言模型以协助译员,常用方法包括检索增强生成(RAG):先检索相关背景资料,再将检索到的信息传入生成模型,生成带来源信息的译文(赵军峰、李翔,2024)。基于 RAG,译者可先借助大语言模型进行背景信息检索,再对术语进行校正与翻译,从而尽可能确定术语翻译的专业性与规范性。
在实践中,借助大语言模型对未规范术语进行质检的方式包括:同义辨析(如“器饰”可译为 “Ornamentation” 或 “Vessel Decoration”),定义检索(如“土葬”)、背景信息检索(如地名、古遗址或部落的历史与分布),以及润色建议(如“竖穴土坑墓”可译为 “vertical pit” 等)。
(三)术语库建立、管理与维护
术语库的建立取决于用户需求,云译客以及 SDL Multiterm 均可用于建库。本项目采用云端模式,“以云计算为依托,可快速搭建定制化的机器翻译系统,并且实现跨系统、跨设备、无安装的互联网服务访问。”(王华树,李智,2020)质检完成的术语以 Excel 导出后建库:支持一键导入(自动去重、格式校验、结构化存储如“中英对照+词性”标签)、智能处理(自动识别拼写差异、同义词,生成标准化条目)与协同审核(专家/项目经理在线协作,批注、投票达成共识),确保术语权威性。
随着考古学的发展,术语更新较快,需及时维护。云译客具有百万级术语存储与弹性计算架构,支持定期扫描行业文档、AI 识别新术语、用户共建(译者提交建议,经审核入库)与动态优化(根据使用频率调整优先级)。未来云译客将结合大语言模型进一步提升自动化与跨领域能力。
二、数智时代下的考古术语库管理启示
在“一带一路”与“理解当代中国”等国家战略背景下,中国文化术语库建设需结合新时代先进技术,以更科学、便捷的方式推动文化对外传播(柳菁,2019)。人工智能的应用提高了术语库建立的效率并减轻人工负担,但也暴露出问题:Sketch Engine 在专业性极强领域的提取仍需人工审核;机器翻译在术语翻译中常出现拼写错误与文化背景缺失等问题,因此专业术语仍需人工二次质检与大语言模型辅助查询后再确定译名。
考古术语库的建立不仅有利于学科发展,也利于文明交流与文化传播。新疆考古成果为还原历史提供证据,促进国际社会对中华文明的正确理解,增强文化软实力与国际话语权(张娓,2021)。总之,人工智能工具须合理且专业地使用,整个术语库建设过程必须保证人工的参与与监督。
参考文献:
- [1] Kilgarriff A. Terminology finding in the Sketch Engine: an Evaluation[C]//Translating and the computer 36 AsLing: Translating and the computer 36 conference, London. 2014.
- [2] Rychl P, Kilgarriff A. An efficient algorithm for building a distributional thesaurus (and other Sketch Engine developments)[J]. text corpus; distributional thesaurus, 2007.
- [3] 冯志伟. 大语言模型时代的术语翻译[J]. 中国科技术语, 2024, 26(03):93-96.
- [4] 华道阳, 胡妮. 基于 SDL multiterm 的航空科技术语管理[J]. 中国科技术语, 2024, 26(02):43-48.
- [5] 姜望琪. 论术语翻译的标准[J]. 上海翻译, 2005(S1):80-84.
- [6] 康宁, 尉莹, 等. 计算机辅助翻译环境下术语库创建、应用与术语管理[J]. 青岛科技大学学报(社会科学版), 2015, 31(03):107-110.
- [7] 柳菁. 敦煌文化汉英术语库建设及术语管理研究[J]. 中国科技术语, 2019, 21(02):17-21.
- [8] 陆秀英, 刘敏. 农业考古术语汉英翻译方法探究[J]. 中国科技翻译, 2019, 32(03):1-3.
- [9] 王炳华. 西域考古历史论集[M]. 北京: 中国人民大学出版社, 2008.
- [10] 王华树, 李智. 人工智能时代的翻译技术研究: 内涵、分类与趋势[J]. 外国语言与文化, 2020, 4(01):86-95.
- [11] 魏向清, 杨平. 中国特色话语对外传播与术语翻译标准化[J]. 中国翻译, 2019, 40(01):91-97.
- [12] 吴丽环. 中华学术外译翻译项目中的术语管理研究——以《新疆史前晚期社会的考古学研究》为例[J]. 上海翻译, 2023(02):32-36.
- [13] 云译客[J]. 中国翻译, 2018, 39(04):2.
- [14] 张娓. 王炳华:新疆考古拓荒人[N]. 中国社会科学报, 2021-11-10(012).
- [15] 赵军峰, 李翔. 大语言模型驱动的翻译智能体构建与应用研究[J]. 外语电化教学, 2024(05):22-28+75+108.
