
全球教育视角
Global Education Perspective
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3580(P)
- ISSN:3080-079X(O)
- 期刊分类:教育科学
- 出版周期:月刊
- 投稿量:2
- 浏览量:469
相关文章
暂无数据
大语言模型的日语语体转换特征研究——基于人际对话语料的人机对比分析
A Study on the Speech-Level Shifting Characteristics of Large Language Models in Japanese —A Comparative Analysis of Human-Machine Dialogue Based on Interpersonal Corpus
引言
近年来,随着人工智能技术的快速发展,人机对话系统(dialog systems)逐渐被广泛应用于日常生活与信息服务场景之中。现有对话系统大体可分为任务导向型对话系统与非任务导向型对话系统两类。前者以完成具体任务为目的,如信息检索、设备操作与事务处理,代表性实例包括语音助手Siri等;后者则以进行闲聊、陪伴式交流为主要目标,强调对自然对话的模拟与用户体验的提升。本研究主题的提出是基于大语言模型在敬语方面的发展性和局限性,因当前大语言模型的敬语使用能力逐步强化,人机对话的发展不仅仅停留在狭义敬语的使用,而是延展到模拟人与人之间对话的真实性与自然性。另一方面,但目前机器尚未充分掌握语体转换,在对话时始终与用户保持较远的距离。与任务导向型系统相比,非任务导向型对话系统在语言层面的自然性要求更高,其生成的对话不仅需要在语义上连贯,还需要在语用层面符合人类会话的习惯。在模拟人类发话行为的同时,受到语言和文化的深刻影响。Yin et al.(2024)指出人机对话系统会根据不同语言的文化规范,对语言的礼貌程度以及语体的使用进行调整。在日语高语境下,这一问题尤为突出。说话者往往通过选择不同的语体来调节正式度、表达社会关系及心理距离。因此,如何在对话系统中恰当地选择和切换语体,成为日语对话系统设计中不可回避的重要问题。
一、文献综述
本研究引用毋育新(2019)对语体转换的定义,即说话者根据会话对象与场景,在是否使用敬语、敬体或简体以及美化语等方面进行的语言表现调整。语体转换可理解为无标记性语体与有标记性语体之间的相互转换。该行为如同敬语使用一样,深受上下关系与亲疏关系的影响,反映出对话双方对于“对谁、以何种方式讲话”的社会规范性意识。在实际交际中,语体并非固定不变,而常涉及动态转换的过程。这一现象在人际交流中十分常见,因而也成为大语言模型发展中不可忽视的一环。若机器能在未获明确指令的情况下,依据用户身份、任务类型或会话进程等上下文因素自主调整语体,且其转换表现出一定的延迟性或策略性缓冲特征,则可推测其语体使用并非简单模仿数据,而可能具备初步的语用意识。人机对话系统的设计目标,正是模仿人类对话方式,实现自然流畅的人机信息交流(曹君阔、陈国莲,2017)。
随着自然语言处理技术的进步,众多研究致力于提升人机对话系统的自然度与流畅性,使其更贴近人类的表达习惯。核心目标之一在于不断优化系统的语言表现,使其能够体现人类特有的语言风格、情感表达及社交互动技巧,从而增强用户体验与人机对话的真实感。Sandler & Morgan(2024)通过对比 EmpathicDialogues 人类语料与1.9万组 ChatGPT-3.5生成对话,分析了两者在语言特征上的差异。该研究借助 LIWC 对118 个语言类别进行检验,结果显示人类对话在语言使用的变异性与真实性上更高,而 ChatGPT 在社会过程、认知表达、分析性语言及积极情绪语气等方面表现突出。尽管两者在情感极性上未见显著差异,但分类实验表明 ChatGPT 在语言结构中隐性地编码了情感倾向。
尽管上述语言策略在理论与设计层面已得到一定验证,但如何评估人机对话系统在实际互动中的表现,仍是一项重要挑战。在此背景下,研究焦点逐渐从“如何表达”转向“如何评估”。随着自然语言处理技术的迭代,针对系统语言表达的评价标准与方法也在不断演进。从人工反馈强化学习(RLHF)到自监督学习,研究者尝试运用多种机器学习技术来调整与评估系统在语言风格适应性、情感表达及礼貌策略等方面的表现。Jiao Ou(2024)提出包含12项对话任务的评估基准DialogBench,用以考察大语言模型作为类人对话系统应具备的能力。测试发现,尽管指令微调可在一定程度上提升模型的类人表现,但在情感理解等方面仍存在明显不足。人机对话系统研究的出发点与最终归宿,在于最大程度地模拟并逼近人机自然对话(Kerly,2007)。这不仅是提升用户体验的关键,也是该领域的终极目标。人工智能研究以认知科学为依归,旨在模拟人类认知方式,追求逼近乃至复现人类智能。
Berg & Clark 将初次见面场景的会话定义为“早期决策与分化阶段”,即关系亲密度确立的关键时期。初次见面是对话双方建立信任与相互了解的重要时刻,对第一印象的形成具有较大影响。日语作为高语境语言,说话者的语体转换对会话双方的交流体验起着至关重要的作用。语体转换体现为说话者根据交际对象、场合及互动进程,对句尾形式等语言资源进行调控的过程。由于日语会话一旦展开即需在常体与敬体之间作出选择,语体问题成为日语自然对话的核心机制之一。针对初次见面场合的对话,现有研究多从参与者之间的上下关系角度展开分析,通过设定双方的社会位阶,探讨其如何依据对方身份选择并转换语体。Nagai, N.(2025)参考 BTSJ 日语自然对话语料库中的语体转换频率与方式,设计了一款非任务驱动型人机对话系统,并以134名用户为被试,通过心理实验检验了系统中语体转换对用户体验的影响。实验结果表明,动态的语体转换有助于调整人机关系,并进一步提升用户对系统的礼貌感知。然而,该系统的语体转换触发机制仍主要依赖敬体使用比例这一表层语言特征,未能考察系统是否基于互动中的角色关系或心理距离变化进行语用判断。总体而言,语体转换是提升对话系统人性化与互动质量的关键因素。
二、研究问题
在此基础上,本研究提出三个核心问题:其一,机器是否具有自发进行语体转换的能力。在不依赖外部明确指令或规则的情况下,机器根据用户的输入信息自动作出反应,从而探究机器是否能识别和理解上下文中的社交信息,并根据这些信息自发地调整其语言风格。其二,机器的语体转换模式与人类有何不同。这一问题是为了探讨机器和人类在语体转换的方式、灵活性、具体表现上的差异。帮助机器逐步模拟人类的语体转换能力,并弥补与人类在理解和适应上的差距。其三,机器的语体转换行为是基于对语用功能的理解,还是输入对齐的表层响应。也就是说机器是否仅仅依靠跟随用户的语体进行转换,还是能够深入分析语境、对话者之间的社交距离、情感和意图,从而做出更为合适和自然的语言风格调整。
围绕这些问题,本文提出可影响机器语体转换的一些触发因素,如话轮的增加、用户的语体变化、用户的身份暗示以及特定情景的关键词等,基于此来设计控制变量以开展实验。
三、实验设计
实验设计分为两组,通过模板化语境与人机互动结合的方式,考察大语言模型在日语对话中的语体使用及其语境适应能力。
(一)对照组
使用BTSJ语料库中初次见面对话的准自然会话语料作为对照,选取了存在语体转换现象的对话段落,作为输入的参考模板。为避免机器对语气词、重复表达、标点格式等非核心因素产生误判,笔者对语料进行了适度清洗,仅保留最能体现语体变化的信息单元,删除了冗余语气词、非必要感叹语和多余标点,使得语料内容更加规范统一,确保其作为语体转换的触发输入时具有一致性与控制性。因为学生间的狭义敬语表现较少,所以将ですます体和终助词附加都看作为敬体。
(二)实验组
以对照组中清洗后的发话语料为原型,与机器进行多轮对话。由于面对面对话与在线文本对话存在一些本质上的差异,例如肢体动作、表情、语气、发话频率等,这些差异对语体转换有较大影响。为了更加贴近面对面对话,Prompt里明确提示机器尽量简洁作答,避免冗余解释,使得机器的输出语料更具自然性和可对比性。
另外,影响语体转换的主要因素有社会距离、年龄、性别、亲属关系、话题展开等多种方面(Ikuta,1983),其中包括影响会话的外因与内因,外因即为社会距离、年龄、性别这种既定的背景因素,内因为话者之间的心的距离、话题展开等因个体而变化的不确定因素(Miyamoto,1998),本研究以可控的外界影响因素为控制变量,在prompt里给出机器明确的会话背景,以达到模拟人与人交流的目标。
(三)Prompt预设
Prompt旨在模拟模板组的语境变化,机器需要基于笔者逐轮输入的内容进行回应,该过程中并未给出任何关于语体使用的显性指令,机器必须依靠语境或用户语体的变化自行判断是否进行语体转换。同时,需记录机器在对话中的首轮语体使用、各轮语体选择、是否进行了语体转换、转换时机及是否伴随缓冲表达等,从而进一步分析其语体变化是否与输入中的语体或语境因素相关。通过这种设置,旨在考察机器在无显性语体指令的条件下,是否能够根据语境的推进,自主进行语体转换。
四、分析与结论
通过对初次见面对话场景中5组10轮对话的语体使用情况进行详细记录与分析,本研究得出了以下主要结论:
首先,机器在默认情况下倾向于使用敬体,这表明机器的语体选择受其训练语料和生成偏好的影响。这一发现反映了机器生成的保守性,倾向于保持一定的正式性和礼貌性,尤其是在初次见面的场景中。
其次,尽管机器能够在察觉到用户语体变化后进行调整,但这种调整往往表现为缓冲性表达。这种缓慢的语体转换过程表明,机器在语体转换时存在策略性保守倾向,避免对话风格的突变,反映出其对对话流畅性的保留与稳定性重视。
最后,机器通常会在对话中维持语体的稳定,直到用户明确示意亲近时才会发生语体转换。即使在Prompt中已经隐含了关系变化的提示,只要用户未主动改变语体,机器也不会主动转换。此结果表明,机器的语体转换依赖于输入对齐,而不具备人类对关系发展的感知能力。
这些发现揭示了机器在语体转换中的局限性,进一步强调了机器对关系变化的依赖性,且其语体选择并非基于情境感知,而是受制于输入信息的指示。这为未来研究提供了改进机器语体转换的方向,尤其是在语境理解和情感适应方面。
五、结语
本研究旨在探讨大语言模型在日语初对话场景中的语体转换能力,特别是其在敬体与常体之间的转换情况,假设AI在模拟自然会话时可能缺乏人类口语中的语体灵活性。通过对比AI生成文本和日本母语者的自然对话数据,研究发现AI在语体转换上的表现较为僵化,缺乏人类会话中的自然过渡与中途终止型发话现象。
本研究的贡献在于揭示了AI在日语语体转换方面的不足,强调了语言模型在应对真实对话中即时调整和情境适应能力方面的局限性。这为未来AI对话生成模型在处理语体转换和语言自然度方面的改进提供了理论依据。
然而,本研究也存在一定局限性。首先,研究语料仅限于初对话场景,且仅针对单一语言环境进行分析,未能涵盖多种情境下的语体变化。其次,AI的语体转换表现可能受到训练数据和模型设计的影响,未来研究可进一步探讨不同模型、不同语料库对语体转换的影响。此外,未来的研究可以扩展至更多的语言对比和跨文化语体转换分析,以全面评估AI在多元语境中的表现。
参考文献:
- [1] 曹君阔,陈国莲. 人机对话系统[M]. 北京:电子工业出版社,2017.
- [2] Yin Z, Wang H, Horio K, et al. Should We Respect LLMs? A Cross-Lingual Study on the Influence of Prompt Politeness on LLM Performance[J]. Proceedings of the Second Workshop on Social Influence in Conversations (SICon2024),2024:9-35.
- [3] 毋育新. 日语敬语教学方略研究[M]. 北京: 北京大学出版社,2019.
- [4] Sandler M, Choung H, Ross A, et al. A linguistic comparison between human and ChatGPT-generated conversations[C]//International Conference on Pattern Recognition and Artificial Intelligence. Singapore: Springer Nature Singapore,2024:366-380.
- [5] Ou J, Lu J, Liu C, et al. Dialogbench: Evaluating llms as human-like dialogue systems[C]//Proceedings of the2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume1: Long Papers).2024:6137-6170.
- [6] Kerly A, Ellis R, Bull S. CALM system: a conversational agent for learner modelling[C]. International conference on innovative techniques and applications of artificial intelligence, London: Springer London,2007:89-102.
- [7] Nagai, Nozomu, Miyamoto, Tomoki, Katagami, Daisuke. Effects of Speech Level Shift Tested by a Non-Task-Oriented Dialog System on Text Chat Dialog with Users in Japanese: A Pilot Study[J]. Applied Sciences,2025,15(07):3897.
