
教育创新与实践
Journal of Educational Innovation and Practice
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3599(P)
- ISSN:3080-0803(O)
- 期刊分类:教育科学
- 出版周期:月刊
- 投稿量:5
- 浏览量:639
相关文章
暂无数据
面向交叉学科学习的智能问题生成系统设计开发与实践研究
Design, Development and Practical Research of an Intelligent Question Generation System for Interdisciplinary Learning
引言
在新工科、新医科、新农科、新文科建设的四新背景下,交叉学科人才培养成为高等教育改革的重要方向。研究表明,近25年来交叉合作研究获诺贝尔奖的比例接近50%,学科交叉融合已成为当前科学技术发展的重大特征。然而,传统学科培养模式往往将不同学科划分为独立领域,导致知识碎片化,各学科发展出自己的理论框架和研究方法,跨学科沟通和合作困难。交叉学科人才培养的核心在于知识整合与迁移能力的培养—知识整合能力要求学生能够识别不同学科知识间的相互辅助、相互依存、相互融合关系,知识迁移能力则要求学习者能够在新知识和原有知识之间建立联系,将所学灵活迁移到实践情境中,实现低阶思维向高阶思维的跃迁。
当前教育实践表明,大学生在交叉学科的学习中面临显著困难。第一是学科界限固化导致学生难以自主建立跨学科知识关联;第二是缺乏即时性、个性化的学习支持,使学生在知识整合与迁移过程中难以获得有效反馈。智能技术为解决上述痛点提供了可能,但现有研究多集中于技术架构设计,针对交叉学科特定情境下的问题自动生成研究仍显不足,特别是如何根据学习者的实时认知状态动态生成促进知识整合与迁移的问题序列的研究尤为匮乏。
一、背景
国家层面高度重视本科教育质量,为智能教育研究提供了坚实的政策支持。2019年,教育部发布《关于深化本科教育改革提高培养质量的若干意见》,明确倡导鼓励学生勤学、广读、深思、善问、勤练。2024年,教育部发布四项行动计划,推动人工智能驱动的教育支持体系建设。该计划强调探索运用数字化工具对教育活动进行监督、检查和评估。这些政策文件构成了建立智能教育基础设施的国家政策框架,表明了通过人工智能技术提高本科教育质量已成为教育改革的重要方向。
生成式人工智能(Generative AI, GAI)技术正在经历从工具辅助定位向认知重构定位的范式进行转型。2024年第61届高等教育博览会上的人工智能技术应用于教育教学的展演表明,人工智能教育软硬件的需求和发展已呈现爆发态势。与此同时,大语言模型的自动问题生成技术取得问题相关度和问题质量方面的突破,主要证据为Kulshreshtha等提出的少样本神经问题生成模型在真实对话式智能导学系统中测试显示,学生学习收益较原来的测试基线提升35%—45%的水平。并且白浩然等开发的GPTutor系统整合检索增强生成(RAG)技术并开展实验,实证研究表明该系统能显著提升学生在课堂学习中的行为投入、认知投入和情感投入。
然而,技术能力的跃升并未自动转化为教育效用的提升。当前研究呈现三个方面的局限。第一方面是学科情境的适配性不足,现有问题生成模型多在开放域文本上训练验证,对于专业课程等特定学科情境中关于知识结构复杂性、概念抽象度、认知层级递进性等特征没有被充分考量;第二方面是生成内容的教育性薄弱,技术评价多聚焦于语法正确性、答案匹配度等表层指标,对于问题能否激发高阶思维、促进知识建构、适配认知发展规律等教育效度维度关注不足,大模型的幻觉风险与教育领域对准确性、可解释性的严苛要求之间的矛盾尚未有效化解;第三方面是学习过程支持深度有限,现有应用多将问题生成定位为练习供给工具,对于如何通过问题序列设计支撑元认知监控、支架式学习、深度学习等教育目标,缺乏系统性的理论建构与技术实现。
基于上述背景和研究现状分析,提出了如何设计与开发面向交叉学科深度学习的问题自动生成系统,以动态支持大学生的知识整合与迁移能力培养?并将该问题分解为三个相互关联的子问题:
其一,如何识别与更新学习者的实时认知状态(比如知识掌握度、认知结构特征、跨学科概念关联能力等),同时精准识别其知识整合盲区与迁移障碍点?
其二,如何将检索增强生成技术(RAG)与提示工程优化策略有效整合,使大语言模型生成符合交叉学科的学科知识范围又能层层递进的高质量问题序列?
其三,生成的问题序列如何通过脚手架式的支架设计以自动组合,有效促进学习者从低阶记忆理解向高阶分析创造的认知跃迁,实现知识迁移与元认知能力发展?
二、理论基础与设计原则
(一)国际经验:人工智能教育融合的挑战与策略
全球人工智能与教育的深度融合正面临技术、伦理、主体、机制及成效五方面的现实挑战。在技术层面,利用人工智能预测价值所面临的挑战以及技术黑匣子问题依然难以克服。算法偏见、缺乏透明度以及生成错误内容等问题直接影响教育应用程序的可信度。在伦理层面,数据隐私风险和教育公平问题尤为突出,人工智能的引入可能对教育公平性和包容性构成挑战。就学科而言,过度依赖人工智能容易导致学生陷入思维惰性,削弱社交能力。在机制层面,监管框架和教师发展机制仍显薄弱。在效能层面,人工智能教育应用的实际效果亟待实证检验。
为应对上述挑战,国际研究提出了五项关键发展策略。第一项策略是建立政府、产业、学术界、研究机构和用户联盟,以建立多利益相关方管理机制;第二项策略是要开发多维度的人工智能教育体系,以增强教师和学生的人工智能技术应用能力;第三项策略是平衡需求与基本原则,以可持续的方式构建智能教育产品生态系统;第四项策略是划分人工智能在教育中的应用场景,并开展影响评估研究;第五项策略是加强资源与支持服务,以整合应用支持能力。这些战略为本研究中的系统设计提供了关键指导——特别是“平衡需求与原则”原则强调,人工智能教育的研究与开发必须聚焦于实际教育需求,严格遵循教育基本原则,并避免技术决定论。
从发展趋势看,人工智能与教育深度融合呈现五大特征:教育、智能科技与人才一体化发展;坚持以师生为本的基本发展理念;教育应用走向包容化和无障碍;人工智能与教育主体实现互惠成长;安全与发展日趋平衡。这些趋势启示本研究应始终将学习者的认知发展置于核心位置,通过人机协同实现智能技术与教育主体的双向赋能。
(二)教学理论:从苏格拉底产婆术到脚手架理论
苏格拉底教学法是一种极具影响力的教育哲学,它强调通过对话和提问引导学生进行自我认知和自我教育。该方法的本质并非教师直接传授知识,而是通过一系列精心设计的提问激发学生的好奇心和批判性思维,促使他们深入探究问题的本质。苏格拉底认为,知识的获取并非来自外部传授,而是源于个人的内在反思和提问;他认为教育的真正目的在于激发这种思考能力。
维果茨基的最近发展区(ZPD)理论与支架教学理论构成了智能教学系统设计的重要理论基础。最近发展区指的是学生实际发展水平(即能够独立解决问题的能力)与潜在发展水平(即在成人指导和同伴协作下解决问题的能力)之间的差距。教育通过聚焦该区域可最大化认知发展。而支架理论则强调,教师在学习过程中提供持续的支持、建议和反馈尤为重要,引导学生基于已有的知识框架逐步构建新的知识框架,如同搭建支架一般。
将上述理论融入智能问题生成系统的设计意味着系统不再直接给出答案,而是根据课程结构和学生知识水平提出一系列问题。通过逐步回答这些问题,引导学生自然解决初始疑虑。设计这样的启发性问题序列,既能有效减轻教师的教学负担,又能增强学生的学习自主性与成就感。
(三)学习科学:知识整合与迁移的理论框架
知识整合理论强调,学生应主动认识不同学术领域知识之间的互补性、相互依存性和相互渗透性。通过“添加—区分—组织”的认知机制,他们将孤立的概念节点连接成相互关联的认知网络。在跨学科背景下,该过程要求学生突破学科壁垒,识别多学科知识之间深层关联,并在元认知层面发展知识框架意识。
知识迁移理论侧重于在新旧知识之间主动建立联系,并区分两种形式:近迁移(在相似情境中的应用)和远迁移(在不同情境中的创造性应用)。后者作为培养跨学科领域高阶思维的基本指标,要求学生灵活运用整合知识结构应对新情境,从而实现认知飞跃—从低阶记忆理解跃升至高阶分析创造。
布卢姆教育目标分类法(修订版)为认知层次框架内的问题设计提供了操作性框架。该分类法将认知过程划分为六个阶段:记忆、理解、应用、分析、评价和创造,为逐步设计问题序列提供了明确的标准。在本研究中,基于该分类法,为知识路径中的每个节点确定了相应的认知水平,确保生成的习题序列符合认知发展规律。
(四)系统设计原则
基于上述理论,本研究确立四项核心设计原则:
第一项原则为知识边界约束原则。通过构建课程知识图谱作为外部知识库,实施检索增强生成(RAG),确保问题生成严格限定于学科知识范围内,有效缓解大模型的幻觉问题,提升生成内容的准确性与可解释性。
第二项原则为认知层级适配原则。基于布鲁姆认知层次识别模型,动态判断知识路径上各节点的认知要求,控制问题的提问方式与思维层级,实现从低阶到高阶的渐进式引导。
第三项原则为个性化路径规划原则。基于学习者的实时知识掌握状态,在知识图谱中检索从已掌握知识到目标问题的个性化路径,在已知与未知之间搭建脚手架,实现因材施教的精准化支持。
第四项原则为人机协同交互原则。借鉴Least-to-Most提示策略,设计多轮问答交互机制,使学习者参与到大模型的推理过程,通过协作探索的方式逐步解决疑惑,培养元认知与自主学习能力。
三、系统架构与核心算法
(一)系统总体架构
本系统遵循智能辅导系统(Intelligent Tutoring Systems, ITS)的经典架构,包含领域模型、学生模型、导师模型和用户界面模型四个基本组成部分。在此基础上,针对交叉学科深度学习的特殊需求,细化为四大领域模型和九大功能模块。
领域模型包括:知识图谱模块—基于课程大纲构建结构化知识库,支持知识点及关联关系的存储与查询;章节测验模块—提供标准化测试以评估学习者知识掌握状态。
学生模型包括:知识水平评估模块—基于Q矩阵建模试题与知识点的蕴含关系,结合作答记录实时更新学习者知识掌握情况。
导师模型包括:知识路径检索模块—基于语义相似度检索目标知识点,并以已掌握知识为起点规划个性化知识路径;认知层次识别模块—识别知识路径上各节点的适配认知层次;问题序列生成模块—融合RAG与提示工程生成递进式问题序列;问答交互模块—支持多轮对话与实时反馈。
用户界面模型包括:交互展示模块—提供简洁美观的界面支持学习活动;后台管理模块—支撑系统的数据管理与基础运维。
智能问题生成系统采用四层架构设计:第一层是数据访问层,该层选择使用MySQL存储结构化数据、Neo4j图数据库存储知识图谱;第二层是算法层,这一层实现知识水平评估、问题—知识点匹配、路径查询、认知层次识别等核心算法;第三层是业务逻辑层,需要封装各功能模块的业务流程;第四层是交互展示层,主要是基于HTML/CSS/JavaScript实现前端界面。
(二)个性化知识路径规划算法
个性化知识路径规划是连接学习者当前认知状态与学习目标的关键桥梁,包含三个核心步骤:
步骤一:知识图谱构建。以目标课程计算机网络的课程章节结构为基础,使用Cypher语言将课程的章节、知识单元和知识点表示为知识图谱,存储于Neo4j图数据库。节点类型包括章节、知识单元和知识点三个层级,关系类型包括包含(章节—知识单元—知识点的层级关系)和后继(知识点间的学习先后顺序)。以计算机网络课程为例,知识图谱涵盖OSI七层模型、互联网上的音视频服务、无线网络和移动网络等核心概念及其关联。
步骤二:知识水平评估。基于Q矩阵建模试题与知识点的蕴含关系,矩阵元素qjk∈{0,1} 表示试题j 是否考察知识点k。结合学习者的章节测验作答记录,采用DINA模型(Deterministic Inputs, Noisy And gate model)的思想计算知识点掌握概率。具体地,对于知识点k,若考察该知识点的全部试题均被正确作答,则判定为已掌握。该评估结果实时更新,为路径规划提供动态依据。
步骤三:路径检索与规划。针对学习者提出的目标问题,系统首先需要基于Sentence-BERT双塔模型对学习者提出的问题进行语义检索,检索之后定位于知识图谱中最相关的目标知识点。同时,在学习者已掌握的知识点集合中检索与目标问题语义最相关的起点知识点。以起点到目标作为终点的路径上逐一整理所需知识点的集合,目标集合完成后采用Dijkstra算法计算最短路径,找到最优学习路径并通过Cypher循环查询补充必要的前驱知识点,形成完整的个性化知识路径。
(三)认知层次识别与提示工程
认知层次识别模型上的工作首先是基于BERT架构设计多标签分类模型,将布鲁姆认知层次的六个类别(记忆、理解、应用、分析、评价、创造)及不相关作为标签集合用以区分问题层次。然后将输入设定为知识描述文本,输出设定为各认知层次的预测得分。模型采用两阶段微调策略:第一阶段是在LearningQ教育数据集上进行领域适应,第二阶段在特定课程(选取计算机网络作为目标课程)的教学目标数据上进行精细化调整。
提示文本构造。采用检索增强生成(RAG)与Least-to-Most提示策略相结合的方案。提示文本包含四个组成部分:任务说明—定义问题生成的目标、格式与约束条件;演示示例—提供符合期望输出格式的样例;检索增强提示(Prompt-RAG)—将个性化知识路径序列化为带认知层次标注的知识描述列表;目标问题—学习者提出的原始疑问。
提示构造遵循路径可循、数量可控、提问方式可靠的设计目标:知识路径的长度决定子问题数量,认知层次识别结果控制各问题的提问方式,路径结构确保问题序列的逻辑递进性。
(四)问答交互算法
借鉴并改进Least-to-Most提示策略,设计人机协同的问答交互机制:
阶段一:问题序列生成。大语言模型(本研究采用GLM-4)接收完整提示,生成包含子问题序列与对应答案的结构化输出。
阶段二:逐轮交互引导。系统依次向学习者呈现单个子问题,等待回答后,将学习者回答、预设答案及历史对话上下文输入模型,要求其进行正误判断并给出解释,同时输出下一子问题。这种设计使学习者参与到大模型的推理过程,形成“互相引导、协作探索”的学习生态。
阶段三:知识水平更新。根据模型对学习者回答的判断结果(正确/错误/不完全正确),实时更新知识掌握状态:回答正确则将该知识点加入已掌握集合,错误或不全正确则移除(若已存在)。这一机制确保后续路径规划的动态适应性。
四、系统实现与效果验证
(一)应用场景与系统实现
本研究选取计算机网络作为跨学科应用的典型场景。该学科融合了计算机科学、通信工程和数学等多领域知识,涉及众多抽象概念和复杂协议。因此,学生们常常面临知识碎片化、概念关联性难把握等问题,这使得能够促进知识整合与转移的智能学习支持系统成为当务之急。
该系统采用Django框架开发,运用MTV(模型—模板—视图)架构。用户界面通过Bootstrap实现响应式设计,支持学生、教师和助教三类角色。为学生提供三项基本功能:章节末测试、成绩查询和智能问答。为教师提供学习进度监控和成绩统计功能。助教负责问题管理和知识图谱维护。
智能问答功能的典型交互流程如下:学习者输入问题(TCP和UDP协议有什么区别?),系统首先检索个性化知识路径(传输层概述→TCP协议特性→UDP协议特性→协议比较分析),识别每个节点中的认知水平(理解→掌握→分析→评估),逐步生成问题序列(解释TCP协议的连接管理机制/UDP协议在传输效率方面具有哪些优势/比较分析两种协议在可靠性机制上的差异/评估实时视频传输场景应选用哪种协议)。学习者依次回答每个子问题,系统提供实时反馈以促进学习者深度思考,最终回归原始问题,掌握整体的知识结构。
(二)算法模块测试
问题与知识匹配模型测试。收集了142个真实的学生问题,并手动标注了相应的知识点。采用三阶段训练方法(初始训练使用中文文本匹配通用数据→使用教育领域数据进行调整→使用具体课程数据进行调整)。测试结果达到78.3%的准确率(MRR@5达0.358),远超基准模型。
认知层次识别模型测试。在预留的40条课程数据上评估,Macro-F1达0.587,Micro-F1达0.723,较传统[CLS]分类方式提升8.9%和4.5%。
问题生成质量测试。在困惑度(Perplexity)、多样性(Distinct-2)、毒性(Toxicity)三个指标上,本系统的提示构造方案分别取得27.581、0.896、0.093的结果,表明生成问题兼具语言流畅性、词汇丰富性与内容安全性。
(三)用户调研与反馈
对参加计算机网络课程的26名学员进行了初步调查,他们使用五点李克特量表对12个描述性要素进行了评分。结果如下:系统生成的题目在语法正确性(4.9分)、激发思考效果(4.55分)以及继续使用系统的意愿(4.65分)方面获得了较高评价。任务质量(4.25分)、答题可能性(4.1分)和知识水平适应性(4.1分)均获得积极评价。逻辑流程(4.3分)和任务解决支持的有效性(4.15分)符合预期。反应速度(2.7分)和正确/错误答案的评判准确性(3.65分)是未来需要重点改进的领域。
五、结语
本研究构建了面向跨学科深度学习的智能问题生成系统。提出融合知识整合理论、迁移学习理论与认知诊断理论的智能辅导系统设计框架,明确技术实现路径:认知状态诊断到个性化路径规划到支架式问题生成。为个性化教学原则的技术实现提供了新的理论视角。开发出融合RAG与认知分层约束的高质量问题生成方法。通过协调知识图谱检索、认知层次识别与由简入繁的提示策略,有机融合学术知识边界约束与认知进程适应性,有效缓解了大规模模型教育应用中的幻觉问题。以计算机网络课程为应用场景,验证了系统的可行性和有效性,为通过GAI提升本科专业课程教学质量提供了可复现的实践范式。
当前研究存在以下局限性:首先是系统响应速度受大型模型API调用延迟的影响,需要通过算法优化和模型蒸馏来提升性能。其次是正确性判定精度仍有待提高,需探索更精细的领域知识注入机制。最后是用户研究样本量有限,导致长期学习效果的实证证据不足。
未来研究将深入以下方向:第一要尝试引入多智能体架构以实现功能协调优化,包括问题生成、认知诊断和学习支持。第二是要整合学习分析技术,用来挖掘学习行为相关数据并优化认知诊断的准确性。第三是要开展大规模准实验研究,以直观系统验证该系统对学术成就、高阶思维和自主学习能力的重要影响。
参考文献:
- [1] 中华人民共和国教育部. 教育部关于深化本科教育教学改革全面提高人才培养质量的意见[EB/OL]. (2019-10-08)[2026-01-02]. http://www.moe.gov.cn/srcsite/A08/s7056/201910/t20191011_402759.html
- [2] 中华人民共和国教育部. 教育部办公厅关于组织编制发布高等学校2023—2024学年本科教学质量报告的通知[EB/OL].(2024-11-21)[2026-01-02]. http://www.moe.gov.cn
- [3] 钟柏昌, 刘晓凡.生成式人工智能何以、以何生成教育[J].电化教育研究,2024,45(10):12-18+27.
- [4] Kulshreshtha D, Shayan M, Belfer R, et al. Few-Shot Question Generation for Personalized Feedback in Intelligent Tutoring Systems[C]//Proceedings of the11th Conference on Prestigious Applications of Artificial Intelligence.2022.
- [5] Chen G, Yang J, Hauff C, et al. LearningQ: A Large-scale Dataset for Educational Question Generation[C]//Proceedings of the AAAI Conference on Artificial Intelligence.2018,32(01).
- [6] 杨现民, 卜浩德, 李新, 等. 人工智能与教育深度融合的国际洞察:挑战、策略与趋势[J]. 电化教育研究,2025,46(09):105-112.
- [7] 王佑镁, 王欣颖, 柳晨晨. 教育领域生成式人工智能应用的伦理风险管理框架研究[J]. 电化教育研究,2024,45(10):28-34+42.
- [8] Mulla N, Gharpure P. Automatic question generation: a review of methodologies, datasets, evaluation metrics, and applications[J]. Progress in Artificial Intelligence,2023,12(01):1-32.
- [9] 杨现民, 卜浩德, 李新, 等. 人工智能与教育深度融合的国际洞察:挑战、策略与趋势[J]. 电化教育研究,2025,46(09):105-112.
- [10] 杨智昊. 启发式问题序列生成系统的设计与实现[D].北京大学,2024.
- [11] Vygotsky L S, Cole M. Mind in society: Development of higher psychological processes[M].Cambridge:Harvard university press,1978.
- [12] Wood D, Bruner J S, Ross G. The role of tutoring in problem solving[J]. Journal of child psychology and psychiatry,1976,17(02):89-100.
- [13] Linn M C, Eylon B S. Science learning and instruction: Taking advantage of technology to promote knowledge integration[M].London:Routledge,2011.
- [14] Barnett S M, Ceci S J. When and where do we apply what we learn? A taxonomy for far transfer[J]. Psychological bulletin,2002,128(04):612.
- [15] Anderson L W, Krathwohl D R. A taxonomy for learning, teaching, and assessing: A revision of Bloom's taxonomy of educational objectives[M].Allyn & Bacon:Allyn & Bacon,2001.
- [16] Lewis P, Perez E, Piktus A, et al. Retrieval-augmented generation for knowledge-intensive nlp tasks[J]. Advances in Neural Information Processing Systems,2020(33):9459-9474.
- [17] Zhou D, Schärli N, Hou L, et al. Least-to-most prompting enables complex reasoning in large language models[C]//The Eleventh International Conference on Learning Representations.2023.
- [18] Nwana H S. Intelligent tutoring systems: An overview[J]. Artificial Intelligence Review,1987,4(04):251-277.
- [19] De La Torre J. DINA model and parameter estimation: A didactic[J]. Journal of educational and behavioral statistics,2009,34(01):115-130.
