
未来教育探索
Exploration of Future Education
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3637(P)
- ISSN:3079-9511(O)
- 期刊分类:教育科学
- 出版周期:月刊
- 投稿量:3
- 浏览量:298
相关文章
暂无数据
智能体赋能财经民办高校教学与评估
Agent Empowerment of Teaching and Evaluation in Private Finance Colleges
引言
人工智能技术的飞速发展正重塑教育生态。教育智能体作为基于大语言模型、具备自主规划与执行能力的智能系统,已从辅助工具演变为推动教育结构性变革的战略性力量。2025年,教育部相关领导在世界人工智能大会上明确指出,智能体是“通用问题的解决器”,标志着其教育应用进入纵深发展阶段。这一发展态势与《中国教育现代化2035》及“国家教育数字化战略行动”中关于推动智能技术赋能教育教学、促进教育公平与质量提升的宏观部署高度契合。在此背景下,探索智能技术与专业教育的深度融合路径具有显著的时代意义。然而,当前相关实践与研究多集中于资源丰沛的公立或综合性高校,对兼具“应用型导向”与“资源约束性”双重特征的财经类民办高校关注不足。
财经类民办高校在人才培养上面临着多重现实矛盾:首先,应用型、复合型人才的培养目标与相对有限的师资、实训平台及行业合作资源之间存在张力;其次,财经领域知识更新迅速、实践性强,课程内容与快速变化的行业需求难以同步;最后,生源基础差异较大,统一的教学进度难以满足个性化学习需求。传统的教学评价模式偏重终结性考核,存在过程性数据缺失、评价维度单一等问题,难以精准衡量智能技术介入下学生复杂技能与综合素养的生成过程。因此,探索适配于该类院校特性的教育智能体应用模式,并构建与之匹配的科学评估体系,具有重要的现实意义。本研究旨在回答两个核心问题:第一,教育智能体如何有效赋能财经民办高校的专业教学?第二,如何构建并验证一个多维度、可操作的学习效果评估框架?研究成果以期为民办高校依托智能技术优化教学资源配置、创新人才培养模式提供新思路。
一、文献综述与理论基础
(一)教育智能体的技术演进与教育应用
教育智能体的发展经历了从通用对话到垂直场景行动的演进。2023—2025年可视为“生成式AI的聊天时代”,已有研究预测,未来3-5年智能体将实现从“对话”到“行动”、从“单点”到“系统”的深刻转变,逐步成为教育领域的核心辅助工具。从技术原理看,教育智能体通常架构在大型语言模型之上,通过感知(理解用户输入与情境)、规划(拆解任务、制定步骤)与执行(调用工具、生成输出)的循环,实现自主任务完成。其核心能力,如自动化决策与长期记忆,依赖于提示工程(Prompt Engineering)、思维链(Chain-of-Thought)以及智能体框架(如ReAct)等关键技术的支撑。在教育领域,智能体的核心能力体现在跨系统协作、自动化决策、长期记忆与知识图谱构建等方面。现有应用已涵盖课程答疑、校园服务、作业批改等场景,但多数仍处于工具性辅助层面,与财经专业教学深度结合、并具备系统性评估的成熟案例尚显匮乏。
(二)国内外研究现状述评
国内外对教育智能体的研究侧重点有所不同。国外研究较早关注智能体在适应性学习系统、智能导学系统中的应用,并注重与建构主义、情境学习等理论的结合,探索智能体作为“认知学徒”或“学习伙伴”的角色。国内研究则随着大模型的爆发而迅速兴起,目前主要集中在应用场景探索、平台开发及初步效果描述上,如智能答疑、作文批改等。总体而言,将智能体深度融入特定专业课程(尤其是实践性强的财经课程)体系,并构建严谨的评估框架以检验其对学生多维能力影响的系统性研究,无论是在国内还是国外,都尚处于起步阶段。这为本研究提供了切入的空间。
(三)财经民办高校教学特征与研究缺口
财经民办高校教学具有鲜明的实践导向、就业驱动与资源约束特征。其学生对可操作技能、实时案例及就业衔接的需求尤为迫切。尽管已有部分高校开展智能体试点,但普遍存在三大缺口:一是智能体功能与财经专业内核(如会计准则、金融模型)结合不深;二是缺乏针对民办学生学情特点的适应性设计;三是尚未建立贯穿教学过程的多维度效果评估机制。本研究试图填补上述缺口,将技术应用置于具体的教学场景与评估框架中加以考察。
(四)理论框架:整合“1:9定律”与多维评估视角
本研究以Yao等(2023)提出的“1:9定律”作为智能体开发与应用的核心方法论。该定律强调,智能体的价值创造仅有10%来源于基础创建,其余90%依赖于持续的场景化训练与优化,其核心逻辑与教育领域“因材施教、持续迭代”的理念高度契合。这契合了民办高校需“小切口、深耕耘”的务实路径。同时,借鉴柯克帕特里克评估模型及教育心理学观点,本研究构建了涵盖认知、行为、情感的三维评估框架,以全面捕捉智能体介入下的学习变化,超越传统仅以考试成绩为衡量标准的局限。
认知维度:主要依据认知目标分类学(布鲁姆),评估学生在知识理解、应用、分析乃至综合层面的提升,特别是程序性知识的掌握(如软件操作)。
行为维度:基于活动理论,关注学生在智能体创设的学习环境中的参与度、互动模式及学习路径的变化,反映其学习投入与自主性。
情感维度:结合技术接受模型(TAM)与控制—价值理论,测量学生对智能体的感知有用性、易用性、信任度以及学习过程中的情感体验(如焦虑、兴趣)。这一整合框架旨在从多视角、多层次评估教育智能体的综合影响。
二、研究设计与方法
(一)研究样本与准实验设计
本研究选取国内某财经民办高校会计学与金融学专业大三本科生为研究对象。采用准实验设计,设置实验组与对照组。样本量通过G*Power3.1软件基于两独立样本t检验估算,参数设定为:α=0.05(显著性水平),β=0.8(检验效能),σ=7(基于预实验数据的标准差),d=0.8(教育干预研究中“大效应量”标准),计算得每组所需最小样本量为42人,最终有效样本为88人(会计44人,金融44人),满足统计检验要求。实验组与对照组由同一批教师授课(确保教学水平一致性),采用相同的教学大纲、课时安排与考核标准。实验组在常规教学外,分别使用定制化的“分录纠错智能体”与“金融模拟智能体”进行辅助学习;对照组仅接受等量资源的传统教学支持(如纸质习题集、线下答疑)。实验期间(2023年9月—2024年1月),沪深300指数波动幅度≤4.2%(市场整体平稳),排除市场行情对虚拟投资收益率的混淆影响。实验周期为一学期,采用前测—后测设计。具体实施流程如下:前测阶段:对所有被试对象进行专业基础测试(认知前测)及SAS焦虑量表、学习兴趣初测问卷调查(情感前测)。培训阶段:对实验组进行为期2课时的智能体操作与功能专项培训,确保其能独立使用。干预期:在中级财务会计和投资学两门核心课程中,教师每周设计一项必需(实验组)或建议(对照组)使用智能体辅助完成的综合性作业或案例任务。研究团队每周通过后台收集实验组交互数据。后测阶段:实验结束后,再次进行认知测试与情感问卷调查,并收集整个实验期间的作业完成数据(行为数据)。
(二)多维评估指标体系的构建与测量
基于理论框架,构建如表1所示的评估指标体系。所有测量工具均进行了信效度检验。其中,“学习兴趣与动机变化量表”和“智能体接受度与信任度量表”为自编问卷。编制过程包括:基于文献分析与对6名专业课教师的访谈形成初始题项池(各15题);邀请3位教育技术专家与2位财经专业教授进行内容效度评定;在小范围(30人)预测试中进行项目分析与信度检验,删除鉴别力低的题项后,最终量表各保留10个题项。信度检验显示,Cronbach's α系数分别为0.87和0.89,均高于0.7的临界值;结构效度检验通过探索性因子分析(EFA)完成,KMO值分别为0.82和0.85(均>0.7),Bartlett球形度检验p<0.001,提取2个公因子(累计方差解释率分别为68.3%和71.5%),所有题项因子载荷均≥0.65,表明量表信效度良好。行为维度中的“知识检索深度与广度”指标,由两位不了解分组情况的专业课教师根据学生查询日志中的关键词与后续问题关联性进行独立评级(1-5级),评分者间一致性Kappa系数为0.78,达到可接受水平。
| 一级维度 | 二级指标 | 测量方法 | 工具/来源 |
|---|---|---|---|
| 认知维度 | 1.财务软件操作正确率 | 标准化上机测试 | 实训系统日志 |
| 2.财务报表分析准确率 | 案例分析与报告评分 | 教师双盲评阅 | |
| 3.金融决策策略合理性 | 虚拟投资组合评估 | 专家评分量表 | |
| 4.审计案例判断正确率 | 审计流程与结论测试 | 标准化试题 | |
| 行为维度 | 1.智能体交互频率与时长 | 后台数据自动采集 | 智能体日志 |
| 2.作业提交质量与及时性 | 教学管理系统记录 | LMS数据 | |
| 3.虚拟实训系统使用深度 | 操作步骤与时长分析 | 实训平台数据 | |
| 4.知识检索深度与广度 | 查询关键词分析 | 日志分析、教师评级 | |
| 情感维度 | 1.学习兴趣与动机变化 | 李克特五点量表 | 自编问卷 |
| 2.学习焦虑水平 | Zung氏焦虑自评量表(SAS) | 标准化量表 | |
| 3.智能体接受度与信任度 | 技术接受模型(TAM)改编问卷 | 自编问卷 |
数据来源:基于柯克帕特里克评估模型、布鲁姆认知目标分类学等理论构建,测量工具经信效度检验。
(三)智能体技术架构与功能设计
本研究使用的“分录纠错智能体”与“金融模拟智能体”均基于GPT-4大模型进行领域微调,技术架构包含感知层、规划层、执行层与知识库层,具体设计如下:
技术架构:感知层:通过自然语言处理(NLP)解析学生输入的作业内容、操作指令与疑问;规划层:基于思维链(Chain-of-Thought)与ReAct框架,拆解复杂任务(如审计案例分析步骤);执行层:调用财经专业工具(如SAP模拟接口、Excel函数库)生成反馈与结果;知识库层:整合《企业会计准则(2023版)》、CFA一级核心知识点、300+真实企业财经案例(经脱敏处理),并建立实时更新机制(每月同步财税政策变化)。
核心功能:分录纠错智能体:支持错误定位(精确到操作步骤)、准则关联解释、相似案例推送三大功能;金融模拟智能体:提供实时脱敏行情数据、虚拟投资组合构建、风险指标(VaR、夏普比率)计算与逻辑解析功能。
易用性设计:界面采用“学生—智能体—教师”三方交互模式,支持文字、截图上传与语音提问,响应延迟≤2秒,符合民办高校学生的操作习惯。
(四)数据分析方法
采用SPSS26.0进行数据分析。主要方法包括:描述性统计、独立样本t检验(比较组间差异)、配对样本t检验(比较前后测差异),以及相关分析,显著性水平设定为p<0.05。此外,对行为日志中的操作序列数据,采用滞后序列分析法来识别实验组学生的典型学习路径模式,并与对照组的作业完成路径进行对比。
三、研究发现与分析
(一)认知维度:专业知识与技能掌握显著提升
实验组学生在各项认知技能测试中均显著优于对照组(p<0.05)。如表2所示,在Excel高级函数和SAP系统操作等实践性极强的项目中,实验组正确率提升幅度达15%以上。尤其在“虚拟投资策略收益率”这项综合能力指标上,实验组平均收益率(19.8%)显著高于对照组(16.2%),提升幅度达22.2%。结合行为数据分析,实验组学生在智能体引导下,更倾向于构建分散化投资组合(股票、债券、大宗商品配置比例平均为55:30:15),而对照组多为单一行业持仓(平均占比78%);同时,实验组对VaR、夏普比率等风险指标的应用频率较对照组高38.5%,表明智能体有效提升了学生的风险控制意识与综合投资决策能力。
| 测评项目 | 实验组(均值±标准差) | 对照组(均值±标准差) | 提升幅度 |
|---|---|---|---|
| Excel函数使用正确率(%) | 82.3±6.7 | 63.6±7.2 | 18.7% |
| SAP系统操作正确率(%) | 79.5±8.1 | 64.2±7.8 | 15.3% |
| 虚拟投资策略收益率(%) | 19.8±5.3 | 16.2±4.9 | 22.2% |
| 审计案例判断正确率(%) | 78.6±6.5 | 62.2±7.1 | 16.4% |
数据来源:实验后测标准化上机测试(Excel、SAP操作)、专家双盲评阅(审计案例)、虚拟投资平台自动统计(投资收益率),n=88(实验组44人,对照组44人)。
值得注意的是,实验组内部成绩的标准差普遍小于对照组(例如Excel项目:6.7vs7.2),暗示智能体的个性化支持可能有助于缩小学生间的技能差距。质性访谈资料为此提供了佐证。多位学生访谈印证了智能体的辅助价值。一位会计专业学生表示:“以前在机房练SAP,错了也不知道具体哪步不对,很沮丧。现在用智能体,它就像个有耐心的教练,不仅能指出‘第3步的物料凭证类型选错了’,还会解释为什么该选‘WA’,并马上给一个类似的例子让我再做一遍。这样学,理解得透,也记得牢。”另一位金融专业学生反馈:“智能体的虚拟投资模拟能实时告诉我持仓的风险点,比如‘你的科技股仓位占比60%,超出合理分散比例,建议配置20%债券类资产’,这种动态反馈比静态的教材案例更实用。”参与实验的教师也表示:“智能体承担了大量重复性答疑和纠错工作,让我有更多时间关注学生的个性化思维引导。”这表明,智能体通过提供及时、精准的反馈和scaffolding(支架),有效降低了学生在复杂操作中的认知负荷,促使其将注意力从机械记忆步骤转向理解操作背后的商业逻辑,从而实现了从程序性知识到概念性理解的迁移。
(二)行为维度:学习参与度与自主性增强
后台行为日志分析表明,实验组学生的学习参与模式发生积极转变:
交互活跃:实验组学生平均每周主动使用专业智能体3.0次,每次平均时长约30分钟,表明其将智能体视为常态化的学习伙伴。
实训深化:在虚拟实训系统中,实验组平均使用时长较对照组增加42.3%,且操作序列更复杂,表明探索与试错学习更深入。
作业质量改善:实验组作业提交及时率高达92.7%,且典型错误率下降35.6%,反映出智能体的即时纠错功能提升了练习的有效性。
相关分析显示,“智能体单次交互时长”与“作业错误率降低幅度”呈显著负相关(r=-0.52,p<0.01),说明深度、沉浸式的交互与学习效果的提升密切相关。滞后序列分析进一步揭示,实验组学生出现“查看错误提示→检索相关知识库→修改后再次提交”这一“纠错学习循环”的频率显著高于对照组。行为数据的这些变化,印证了智能体作为“随时可用的学习脚手架”,促进了学生从被动接受向主动探究、及时反思的学习行为转变。
(三)情感维度:学习体验与态度正向转变
情感维度测量结果显示智能体对学生的心理层面产生了积极影响:
焦虑缓解:实验组学生的SAS焦虑评分后测较前测平均降低13.2分,降幅显著大于对照组(2.1分)。学生反馈,智能体提供的“无评判”练习环境和随时可得的支持,降低了其对失败的恐惧。
兴趣与信心提升:76.3%的实验组学生报告对专业课程的兴趣增加,84.6%的学生表示对智能体提供的专业建议持信任态度。这种信任感转化为更强的学习自信心。
对TAM问卷数据的进一步分析显示,实验组学生对智能体的感知有用性(PU)和感知易用性(PEOU)平均得分分别为4.32和4.15(5点量表)。路径分析表明,PEOU对PU有显著正向影响(β=0.61),而PU又直接且显著地影响了学生的使用意愿(BI)(β=0.73)和实际使用行为。这从技术接受的理论层面解释了情感态度转变的内在机制:学生因为觉得智能体容易上手(PEOU高),进而认识到它对学习的帮助(PU高),最终愿意并实际去使用它,并在使用中获得积极体验,形成正向循环。
四、讨论
(一)研究发现的理论阐释
本研究的结果可以从多个学习理论视角得到阐释。首先,认知负荷理论认为,学习者的工作记忆容量有限。财经软件操作和复杂案例分析包含大量交互步骤与规则,易导致较高的外在认知负荷。智能体通过提供分步引导、即时纠错和按需解释,有效地管理和降低了这种外在负荷,使学生能将更多认知资源用于理解核心概念和问题解决策略(生成性认知),这直接解释了认知维度成绩的显著提升。其次,情境学习理论强调“合法的边缘性参与”。虚拟仿真实训与案例智能体为学生创造了一个接近真实的、低风险的职业实践情境。在这个情境中,学生可以通过与智能体的互动,模拟完成会计记账、投资分析等专业实践,从“边缘”逐步走向“中心”,从而促进了默会知识的习得和实践能力的增长,这与行为维度上实训深度和复杂度的增加相吻合。最后,技术接受模型(TAM)很好地框架了情感维度的变化。本研究中智能体较高的感知易用性和有用性,是学生产生信任、降低焦虑、提升兴趣的关键前因,最终促进了积极的使用行为和学习体验。
(二)与已有研究的对话与贡献
相较于现有研究,本研究的贡献主要体现在三个方面:第一,场景深化。不同于多数研究将智能体作为通用问答或批改工具,本研究将其深度嵌入财经专业核心课程的具体教学场景(如分录纠错、投资模拟),并开发了具有领域针对性的功能,验证了其在复杂技能训练中的独特价值。第二,评估系统化。本研究构建并实证检验了一个包含认知、行为、情感三个维度的综合评估框架,突破了传统评价仅关注知识成绩的局限,为全面衡量智能体教育成效提供了可操作的指标体系。第三,模式提炼。基于“1:9定律”和实证数据,提炼出适用于资源受限的民办高校的智能体“创建—训练—应用”循环模式,强调了持续训练与迭代的重要性,为同类院校提供了从建设到应用的全流程参考。
(三)民办高校智能体应用模式构建
基于“1:9定律”与实证发现,本研究提出一个适用于财经民办高校的智能体“创建—训练—应用”三阶段循环模式(图1)。
(注:该模式通过 “创建—训练—应用—评估—优化”的循环,实现智能体与财经教学的深度融合,适配民办高校资源约束特征)
创建阶段:定位为“严谨的财经实践教练”,其知识库需深度整合教材、行业准则(如财政部最新规范)与真实企业案例,确保专业性。
训练阶段:此为关键。需进行大量场景化“提示工程”训练,例如训练智能体以“苏格拉底式提问”引导财务报表分析,而非直接给出答案。同时,必须建立持续的知识更新机制,紧跟财税金融政策变化。
应用阶段:倡导“教师主导设计、智能体辅助执行、学生深度参与”的协同模式。教师角色转向学习过程设计者与引导者。
(四)场景化应用创新实践
会计课程:“分录纠错智能体”不仅能标识错误,更能关联会计准则条款解释原因;“审计案例智能体”可模拟审计底稿生成与风险点排查流程。在大连财经学院的实践中,学生使用审计智能体处理一份模拟购销合同。智能体引导学生依次完成“检查合同条款完整性→识别关键商业条款与会计影响→评估潜在舞弊风险点→生成初步审计关注事项清单”的流程。原本需要20分钟才能完成的合同审阅,在智能体结构化引导下缩短至3-5分钟,且考虑更加周全。教师则利用节省的时间,组织学生对智能体识别出的“高风险点”进行小组讨论和辩论。
金融课程:“模拟交易智能体”可结合实时行情数据(经脱敏处理)创设动态投资情境;“风险管理智能体”可引导学生计算VaR等指标,理解模型背后的逻辑。
跨专业融合:开发“财经政策解读智能体”,自动抓取并解读最新宏观政策,训练学生的信息敏锐度与行业洞察力。
五、结论、建议与展望
(一)研究结论
本研究证实,教育智能体通过提供个性化、场景化的学习支持,能有效提升财经民办高校学生在认知、行为、情感三个维度的综合学习成效。智能体的成功应用严格遵循“1:9定律”,其价值源于持续、精细化的场景训练与迭代。一个融合过程性与结果性数据的多维评估体系,对于科学评价智能体教育价值至关重要。
(二)优化策略建议
院校层面:制定“三年智能体应用发展规划”,第一年完成财税金融领域核心知识库(含2000+会计准则条款、500+真实案例、100+政策文件)建设,第二年打通与教务管理系统(LMS)、虚拟实训平台的数据接口,实现学习数据互通;设立“智能体教学应用创新基金”(年度预算50万元),支持跨学科教师团队(计算机+财经)开发课程专用智能体,申报条件包括“与核心课程深度绑定”“具备个性化反馈功能”,验收标准为“学生使用率≥80%”“学习效果提升≥10%”,优秀成果纳入校级教学成果评定(加分权重等同于核心期刊论文)。
教师层面:实施“智能教育素养”分层培训,初级班(24课时)覆盖智能体基础操作与教学场景设计,中级班(36课时)聚焦提示工程、知识库更新方法,高级班(48课时)侧重基于智能体的混合式教学模式创新;设立专项激励措施:将智能体应用成果纳入教师绩效考核(占比15%),开发并投入使用的专用智能体每项奖励1-3万元,发表相关教学研究论文给予双倍科研积分。
技术层面:与企业合作开发轻量化、场景化的专用智能体,注重数据安全与隐私保护,建立符合教育伦理的使用规范。呼吁行业与教育主管部门共同研讨,制定《教育智能体财经领域知识库与交互标准》,促进资源共建共享与规范发展。
(三)研究局限与未来展望
本研究存在一定局限:样本来源于同一院校,普适性有待更多院校验证;实验周期较长但尚未追踪长期效果(如就业竞争力)。此外,情感数据主要依赖自陈量表,未来可结合生理传感数据(如眼动、皮电)进行多模态情感计算,使测量更客观。对行为数据的分析也可进一步深化,如利用社会网络分析研究智能体介导下学生协作模式的变化。未来研究可纵向追踪智能体对学生职业发展的影响,并探索“教师—智能体”协同教学的最佳实践模型,同时关注智能体应用中可能带来的数字鸿沟与伦理问题。展望未来,“多智能体协作”可能成为新的研究方向,即由多个扮演不同专业角色(分析师、审计师、风控官)的智能体与学生组成虚拟团队,共同完成复杂的综合性财经项目,以培养更高阶的协同决策与问题解决能力。
参考文献:
- [1] 中华人民共和国教育部.教师数字素养[N].中国教育报,2023-04-14(002).
- [2] 祝智庭,彭红超.技术赋能智慧教育之实践路径[J].中国教育学刊,2020(10):1-8.
- [3] 李芒,杨宇轩.论教育技术中的“卡脖子”技术[J].现代教育技术,2023,33(10):1-7.
- [4] 刘三女牙,彭晛,沈筱譞,等.数据新要素视域下的智能教育:模型、路径和挑战[J].电化教育研究,2021,42(09):5-11+19.
- [5] 陈默,杨玉辉,杨清元,等.智能体赋能高等教育变革:基于DeepSeek-R1的范式重构与“浙大先生”实践探索[J].现代教育技术,2025,35(05):111-118.
- [6] 胡暄悦.高校智能体建设从问答到赋能的路径探索[J].中国教育网络,2025(10):13-15.
