
全球教育视角
Global Education Perspective
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3580(P)
- ISSN:3080-079X(O)
- 期刊分类:教育科学
- 出版周期:月刊
- 投稿量:1
- 浏览量:214
相关文章
暂无数据
基于行业标准的知识图谱构建与电力机车专业教学赋能研究
Research on Knowledge Graph Construction Based on Industry Standards and Its Enhancement in Professional Teaching for Electric Locomotives
引言
电力机车是现代铁路运输高效运行的核心载体,其技术复杂度高,涉及牵引、制动、控制等多子系统的协同工作,国家及行业技术标准(如GB/T系列、TB/T系列)既是确保机车全生命周期技术合规与运营安全的核心依据,也是铁路相关专业教学中衔接理论与工程实践的关键内容。当前电力机车相关课程教学存在一些突出问题,一是行业标准文本语言专业性强、逻辑结构复杂,学生难以准确理解技术指标背后的工程逻辑与实际应用场景,导致技术标准的学习与理解困难;二是传统教材章节设置与技术标准层级结构不匹配,教学资源缺乏跨章节的语义关联,学生无法建立“理论知识—行业标准”的对应认知,难以实现知识的融会贯通;三是在实践教学环节中,教师需面对大量学生开展个性化指导,精力有限,难以保证每位学生操作的规范性,最终导致学生的标准应用能力普遍薄弱。知识图谱(Knowledge Graph,KG)作为一种结构化知识表示方法,能够将碎片化的标准文本转化为“实体—关系—属性”的结构化网络,有效解决知识组织分散的问题,为标准知识的系统化呈现提供支撑。《DL/T2725—2023电网设备知识图谱构建技术导则》的发布,进一步规范了电力领域知识图谱的构建流程与质量要求,为电力机车领域知识图谱的构建提供了重要参考。DeepSeek作为我国自主研发的大语言模型,具备专业领域的语义理解与生成能力,可实现行业标准知识向教学语言的转化,降低学生学习门槛。本研究通过“标准结构化(知识图谱)—智能交互(大模型)—教学赋能(场景落地)”的技术链路构建教学智能体,旨在建立“行业标准—专业教学—能力培养”之间的映射关系,推动教育内容与产业需求的精准对接,助力解决当前教学中的核心痛点。
一、相关工作
(一)行业标准知识图谱构建
行业标准的结构化表示是其在教学场景中有效应用的基础前提。Bizer等提出的Linked Data原则,明确了“实体唯一标识—关系语义定义”的核心规范,为标准知识图谱的构建提供了理论框架与技术依据。在职业教育领域,张立国等针对高职大数据技术专业,构建了融合行业标准与实训操作的知识图谱,通过“标准解读—实操指导”的关联设计实现理论与实践的衔接,并创新性地设计图谱更新机制,以适配行业标准年均15%的更新速率,确保知识的时效性与实用性。王树森等在计算机学科知识图谱构建中,采用“规则约束+预训练模型”的混合抽取策略,将实体抽取准确率提升至92.3%,为专业领域文本的知识抽取提供了可复用的技术方案。
林正平、吕黔苏等针对电力设备数据检索效率低的问题,提出基于Power Roberta-Bi LSTM-CRF模型的电力设备标准知识图谱构建方法,通过该模型实现电力设备标准文本中实体与关系的精准识别,同时设计自顶向下的本体构建模型为图谱骨架提供支撑,其研究验证了专业预训练模型在电力领域标准知识抽取中的优势,为电力机车标准文本的知识提取提供了技术参考。《电网调度知识图谱构建及故障处理框架》则提出了包含数据采集预处理、知识建模存储、推理应用等环节的技术框架,强调了多源异构数据整合在知识图谱构建中的核心作用。此外,《DL/T2725—2023电网设备知识图谱构建技术导则》(以下简称DL/T2725—2023)明确要求知识图谱需包含实体、关系, 属性三大核心要素,并规范了数据质量把控流程,为电力机车标准知识图谱的规范化构建提供了直接依据。
然而,现有研究多聚焦于技术标准的结构化存储与关联,缺乏针对教学场景的属性设计,如“教学释义”“教材关联”“例题链接”等教学适配性属性,导致行业标准知识图谱与教学需求的匹配度不足,难以直接服务于课堂教学过程,无法有效解决学生标准学习与应用的难题。
(二)大模型与教学智能体融合
Transformer架构的提出,为大语言模型语义理解能力的提升提供了核心支撑,推动教学智能体从“单一查询工具”向“综合决策系统”升级。周明等通过Lang Chain中间件实现知识图谱与大模型的实时交互,在工程教育问答场景中有效降低错误率62%,显著缓解了大模型“知识幻觉”问题,提升了回答的准确性与可靠性。刘三女牙等提出基于检索增强生成(RAG)的智能教学助手架构,将结构化知识与模型生成能力相结合,使回答准确率提升至89.7%,为专业教学场景的智能交互提供了技术参考。
洛阳理工学院基于Dify智能体引擎构建的“虚仿实验教学平台”,通过“Ollama+Dify+本地知识库”技术架构,实现了实验指导的智能化闭环,其采用的RAG机制有效解决了大模型幻觉问题,为电力机车教学智能体的开发提供了实践范式。卢宇、余京蕾等在研究中提出以大模型为核心的教学智能体框架,涵盖“教育任务设定—规划—实现”全流程,支持多角色交互,其“动态进化”设计理念为教学智能体的功能拓展提供了理论依据。在国产大模型应用方面,DeepSeek的R1系列通过优化工科领域的推理逻辑,已在机械、电子等专业的教学场景中展现出优势,能够精准理解专业术语与工程问题。但DeepSeek大模型针对电力机车行业标准的教学适配研究仍处于空白阶段,缺乏结合该领域标准文本特征与教学需求的定制化开发,无法满足电力机车专业教学的个性化需求。
(三)智能体赋能专业教学
智能体在专业教学中的应用聚焦于“理论实践一体化”需求,旨在通过技术手段提升教学效率与学生的实践能力。吴忭等以“机械制造基础”课程为例,开发了涵盖“知识查询—习题生成—学情分析”功能的智能助教系统,通过实证研究验证了专业智能体对教学效率的提升作用。王磊研究表明,以行业标准为导向的智能教学工具,能够使学生的标准应用能力提升30%,凸显了标准与教学融合的重要性。河南农业大学在《机器人驱动与运动控制》课程中应用AI智能体技术,构建了“课堂—实验—工厂”一体化教学模式,显著提高了学生学习积极性与课程参与度。西安交通大学开发的“交晓智”平台,为师生构建专属智能体,实现了智能备课、学业预警等全教学环节的赋能,拓展了智能体在教学管理中的应用场景。张强等基于BERT模型的行业标准实体抽取研究,将实体识别准确率提升至91.2%,为知识图谱构建中的核心技术环节提供了性能参考。
综上可得,现有研究虽在智能体赋能教学方面取得一定成效,但缺乏针对电力机车专业“标准—理论—实践”三维协同的具体赋能方案,难以解决该领域教学中标准应用能力薄弱的核心痛点,无法满足产业对高素质技术技能人才的需求。
二、研究方法
(一)电力机车行业标准知识图谱构建
本研究构建电力机车知识图谱的技术框架,采用“自顶向下”与“自底向上”相结合的构建模式,参照《DL/T2725—2023》的技术要求,以国家及行业技术标准文本为数据基础,通过领域分析、知识抽取、存储可视化三个核心阶段完成知识图谱构建,如图1所示。
1. 数据来源与预处理
研究数据源选取电力机车行业的核心技术规范文档,包括28项国家标准(GB/T系列,如GB/T35745-2017《铁路机车牵引功率测试方法》、GB/T25122.1-2010《铁路机车车辆车轴设计与强度计算方法》)与15项行业标准(TB/T系列,如TB/T3552-2020《铁路机车制动系统技术条件》)等,共计43份文档,具体如图2所示。
数据预处理阶段主要包括三步,首先,从PDF格式的原始文档中提取纯文本内容,采用PyPDF2工具实现文本解析;其次,去除文档中的页眉、页脚、图表引用、目录等无关信息,保留正文条款,通过正则表达式匹配过滤冗余内容;最后,将段落化文本切分为独立的句子单元,作为知识抽取的最小处理单位,采用jieba分词工具实现句子分割。数据处理全过程严格遵循《DL/T2725—2023》中数据质量把控要求,确保数据的准确性、完整性与一致性。
2.领域知识体系构建
知识体系(Schema)是知识图谱的核心骨架,以本体(Ontology)形式定义数据模型,明确图谱中实体、关系和属性的类型与约束。参照知识建模规范,本研究采用“自顶向下”的构建方式,结合电力机车领域专家知识与DeepSeek大模型的上下文理解能力,共同完成领域知识体系的设计。
通过对43份标准文本的深入分析,将领域核心概念抽象为8类实体:标准(Standard)、产品(Product)、工艺(Process)、部件(Component)、设备(Equipment)、标志(Marking)、构件(Structure)、试验(Test)。在关系类型定义上,明确了实体间具有语义关联的8类关系:属于(is)、代替(replaces)、规定(specifies)、测试(tests)、满足(satisfies)、引用(cites)、包含(includes)、适用(applies to)。同时,为适配教学需求,新增“教学释义”“教材关联”“例题链接”等教学属性。
3. 基于混合策略的知识抽取
知识抽取是知识图谱构建的核心环节,其目标是从非结构化文本中精准识别实体并抽取实体间的关系。参照林正平等人的研究方法,本研究设计了结合大型语言模型(LLM)与预训练语言模型(BERT)的二级混合抽取策略,以提升知识抽取的准确性与效率。
第一阶段是基于大型语言模型的批量化预标注。利用大型语言模型的零样本或少样本学习能力,结合指令微调(如“从‘GB/T35745-20176.1条’文本中抽取实体及关系,输出格式为(实体1,关系,实体2)”),批量生成初始三元组预标注数据。第二阶段是人工审核与数据集构建。大模型生成的标注结果可能存在事实性错误或精度不足的问题,因此特邀请领域专家与专业教师组成审核小组,对预标注结果进行核对、修正与补充,构建高质量标注数据集,共标注1200条有效三元组。第三阶段是基于BERT模型的领域适应性微调。为了使模型更精准地适配电力机车领域的特定术语和句法结构,选用BERT模型作为核心抽取模型,使用第二阶段构建的数据集,对预训练的BERT模型进行微调,重点优化命名实体识别(NER)与关系抽取(RE)两个核心任务。第四阶段是模型推理与批量化知识获取。微调完成后,将训练好的领域BERT模型应用于全部预处理完毕的文本语料。模型自动推理并抽取实体与关系,输出结构化三元组信息。抽取的三元组以CSV格式存储,包含节点表(实体ID、名称、类型、教学属性)与三元组表(源实体、目标实体、关系),导入Gephi工具生成知识网络拓扑图,实现知识图谱的可视化展示,便于师生直观理解知识关联。
(二)教学智能体开发
教学智能体采用“感知—决策—执行—安全”四层架构,以构建的电力机车行业标准知识图谱为“事实库”,DeepSeek大模型为“语义核心”,通过检索增强生成(RAG)技术实现精准交互,确保回答的准确性与教学适配性。
1. 开发环境与工具选型
开发环境与工具选型围绕“教学适配性”与“技术可行性”两大核心原则展开,具体选型结果如表1所示。
| 工具/框架 | 版本 | 选型依据 | 教学适配性 |
|---|---|---|---|
| Python | 3.9 | 支持主流数据处理库,教育领域应用广泛 | 便于师生二次开发与功能扩展 |
| Neo4j | 5.0 | 图数据库性能优异,支持可视化展示 | 辅助学生直观理解知识关联 |
| DeepSeek API | V1 | 国产大模型,响应速度≤2s,成本可控 | 满足课堂实时交互需求 |
| Lang Chain | 0.1.0 | 封装RAG流程,支持图谱—模型协同 | 模块化设计便于功能扩展 |
| Streamlit | 1.29.0 | 快速构建Web界面,无需前端经验 | 生成简洁易用的操作界面 |
2. 核心模块实现
感知层:支持文本输入与图像输入两种交互方式。文本输入采用jieba分词工具提取关键词,分词准确率达96.8%,可精准识别用户需求;图像输入则通过DeepSeek-VL模型识别实验截图,识别精度达89.2%,能够判断实验操作的规范性。
决策层:基于Lang Chain Neo4j Vector将感知层提取的关键词转化为Cypher查询语句,实现知识图谱的精准检索;将结构化检索结果格式化为“标准条款+教学释义”的教学化文本,完成知识融合;设计教学专属提示词(明确要求包含“标准依据+释义+教材关联+学习建议”四要素),调用DeepSeek-chat模型生成最终回答,其中设置temperature=0.3以确保回答的严谨性。
执行层:封装三大核心功能模块。标准查询模块支持“按标准号查询”与“反向查标准”;指标解释模块返回“标准要求+教学释义+教材例题”;实验指导模块通过对比实验数据与标准阈值,给出合规判断与操作修正建议。
安全层:采用三级安全保障机制。角色权限控制保证师生仅具备查询/使用权限,管理员具备图谱更新权限、AES-256数据加密则保护学生学习数据、DeepSeek内容过滤机制用于过滤违规操作指导,确保了系统安全可靠运行。
(三)教学赋能方案设计
针对“理论—实践—考核”三维教学体系,设计个性化教学赋能路径,实现行业标准知识与教学全流程的深度融合,提升教学质量与学生能力。
1. 理论课程赋能
在理论课程讲解过程中,教学智能体同步关联行业标准,帮助学生建立“理论知识—行业标准”的认知链路。例如,在讲解“牵引功率”相关理论时,教师操作智能体输入“展示GB/T35745-2017中持续牵引功率的技术要求”,智能体自动返回标准条款原文、教学释义与关联教材页码。
基于学生的学习行为数据,智能体为学生推送个性化学习清单。例如,针对频繁查询“制动系统标准”的学生,智能体推送标准学习建议与配套练习题。此外,教师可通过智能体生成课堂提问,如输入“基于GB/T25122.1-2010,设计车轴强度计算的课堂提问”,智能体生成符合教学逻辑的问题。
2. 实践课程赋能
在实践课程环节,教学智能体为学生提供全流程指导,确保实验操作的规范性与安全性。实验前,学生输入“查询GB/T35745-2017牵引功率测试的操作步骤”,智能体返回结构化操作流程,并关联已有的实验室设备操作视频。
实验过程中,智能体实时提醒安全规范与操作要求,如“依据TB/T3552-2020第8.2条,实验前需检查制动管路压力是否≤0.8MPa”。实验结束后,学生可通过智能体获取实验报告中标准引用的模板,教师可使用“报告评分辅助”功能,智能体自动提取报告中的标准引用内容,生成评分参考。
3.课程考核赋能
在课程考核环节,教学智能体辅助教师生成综合性作业与过程性评分报告。例如,针对“机车检修工艺”课程,智能体生成融合多标准应用的作业题。智能体可自动批改作业中的客观题,对主观题生成批改参考。
考核过程中,教师通过智能体实时记录学生操作的标准符合性,智能体自动统计评分项完成情况,生成过程性评分报告,包含“标准应用准确率”“操作规范性得分”等指标,为教师评价学生能力提供数据支撑。
三、研究结果
(一)知识图谱构建结果
本研究构建的电力机车行业标准知识图谱共包含10379个节点(实体)与11905条边(关系),如表2所示,通过Gephi工具进行网络拓扑分析,如图3所示。
| 指标类别 | 具体指标 (Indicator) | 数值 (Value) |
|---|---|---|
| 网络规模 | 节点数 (Number of Nodes) | 10379 |
| 边数 (Number of Edges) | 11905 | |
| 平均度 (Average Degree) | 2.294 | |
| 网络密度 | 图密度 (Graph Density) | ~0 |
| 网络连通性 | 网络直径 (Network Diameter) | 27 |
| 平均路径长度 (Average Path Length) | 6.622 | |
| 连通部件数 (Connected Components) | 1050 | |
| 网络聚集性 | 平均聚类系数 (Avg. Clustering Coeff.) | 0.028 |
| 社群结构 | 模块化得分 (Modularity) | 0.888 |
| 社群数量 (Number of Communities) | 1086 |
可以得出以下关键结论:
网络结构特征:知识图谱的平均度为2.294,图密度接近0,具备典型的稀疏网络特征,符合《DL/T2725—2023》对电力设备知识图谱结构的描述;连通部件数量为1050个,由一个巨大的主连通子图(包含8923个实体)与大量孤立的“知识小岛”构成,绝大多数节点都集中在最大的连通组件中,这个主干网络构成了电力机车领域的核心知识体系;网络直径为27,平均路径长度为6.622,具有显著的“小世界网络”特征,便于学生快速建立知识关联。
社群与节点特征:采用模块化算法进行社群检测,网络模块化得分为0.888,与电力机车领域的子系统分类高度一致;度分布呈现“长尾”特征,少数核心枢纽节点(如“GB/T35745-2017”“牵引功率”)的度数较高(≥50),多数节点度数较低(≤5),说明核心标准与关键概念在知识网络中起到核心连接作用。
(二)教学智能体性能测试
选取30名铁路专业大三学生与5名专业教师,在100次典型教学场景测试中,对教学智能体各功能模块的性能进行评估,测试结果如表3所示。标准查询模块准确率最高(96.5%),响应延迟最短(1.8±0.2s),主要原因是标准号与条款的匹配逻辑相对简单;实验指导模块准确率最低(89.7%),响应延迟最长(2.5±0.4s),因实验场景需结合图像识别技术与多标准交叉判断;内容安全过滤模块准确率达98.2%,响应延迟仅0.5±0.1s,能够有效过滤违规内容。
学生用户体验评分采用5分制,平均得分为4.3分,其中“易用性”评分4.5分,“准确性”评分4.2分,“帮助性”评分4.3分,验证了教学智能体的实用性与教学适配性。
| 功能模块 | 测试场景数量 | 准确率 | 响应延迟 |
|---|---|---|---|
| 标准查询 | 30 | 96.5% | 1.8±0.2s |
| 指标解释 | 30 | 93.2% | 2.1±0.3s |
| 实验指导 | 40 | 89.7% | 2.5±0.4s |
| 内容安全过滤 | 100 | 98.2% | 0.5±0.1s |
四、讨论与展望
本研究可为电力机车相关专业教学提供可复用的技术工具与教学方案,为“知识图谱+大模型”在教学中的应用提供技术路径,同时为人工智能赋能专业人才能力培养提供实践参考。本研究的创新点主要体现在三个方面:其一,提出“行业标准知识图谱+国产大模型”的教学智能体解决方案,通过RAG技术融合知识图谱的“事实准确性”与DeepSeek大模型的“语义生成性”,使智能体输出内容100%标注标准依据,有效规避大模型“知识幻觉”问题;其二,在知识图谱中创新性设计“教学释义”“教材关联”等教学属性,在智能体中开发“标准符合性判断”功能,实现“行业标准—教学实操”的无缝转化,解决教学内容与产业需求脱节的痛点;其三,构建“理论—实践—考核”三维教学赋能路径,为电力机车专业提供标准化、个性化的教学支持,助力提升学生的标准应用能力。
本研究仍存在三方面不足,一是标准文本覆盖范围有限,当前仅包含43份核心国家与行业标准,未涵盖地方标准、企业标准及国际标准,可能导致部分细分领域的知识缺失;二是多标准交叉推理能力不足,当实验场景需同时参考多项标准时,智能体难以自主完成交叉判断,仍需依赖教师干预,这与T/CES227-2023提出的故障处理推理要求存在差距;三是教学效果评估样本量较小,仅选取30名学生进行测试,未覆盖不同层次院校,评估结果的普适性有待进一步验证。
未来研究可拓展标准数据源,收集电力机车领域的地方标准、企业标准及国际标准,构建更全面的标准知识体系;同时开发“标准自动监测—增量更新”模块,参照《DL/T2725—2023》的动态更新要求,确保知识的时效性;提升多标准交叉推理能力,引入“标准优先级规则库”与思维链(CoT)技术,优化模型推理逻辑,使智能体可自主完成复杂场景的多标准交叉判断;开展多院校长期对照实验,联合5—8所不同层次的铁路相关院校,设置实验组与对照组,通过1—2个学期的跟踪评估,验证方案在不同教学场景中的适配性。
参考文献:
- [1] 中华人民共和国国家质量监督检验检疫总局. GB/T35745-2017 铁路机车牵引功率测试方法[S]. 北京: 中国标准出版社,2017.
- [2] Bizer C, Heath T, Berners-Lee T. Linked Data - The Story So Far[J]. International Journal on Semantic Web and Information Systems,2009,5(03):1-22.
- [3] 国家能源局. DL/T2725—2023电网设备知识图谱构建技术导则[S]. 北京: 中国电力出版社,2023.
- [4] 林正平, 吕黔苏, 石嘉豪, 等. 电力设备标准知识图谱构建方法研究[J]. 电气自动化,2025,47(01):54-57.
- [5] 中国电工技术学会. T/CES227-2023 电网调度知识图谱构建及故障处理框架[S]. 北京: 中国标准出版社,2023.
- [6] Vaswani A, Shazeer N, Parmar N, et al. Attention Is All You Need[J]. Advances in Neural Information Processing Systems,2017(30):5998-6008.
- [7] 石念峰. 基于Dify智能体引擎的“虚仿实验教学平台”[EB/OL]. (2025-07-26)[2025-10-08]. https://www.lit.edu.cn/jwc/info/1299/15557.htm
- [8] 卢宇,余京蕾, 陈鹏鹤. 基于大模型的教学智能体构建与应用研究[J]. 中国电化教育,2024(07):99-108.
- [9] Guo D, Yang D, Zhang H, Song J, et al. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning[J].2025.
- [10] 河南农业大学能源与智能工程学院. AI智能体技术在《机器人驱动与运动控制》智慧教学模式下的应用[EB/OL]. (2024-08-02)[2025-10-08]. https://nyydlgc.hnuahe.edu.cn/info/1356/4403.htm
- [11] 西安交通大学. “交晓智”智能教学平台用户手册[R]. 西安: 西安交通大学,2024.
- [12] DeepSeekAI. DeepSeek-VL: 大型视觉语言模型技术报告[R]. 北京: 深度求索(北京)科技有限公司,2024.
- [13] 中华人民共和国国家铁路局. TB/T3552-2020 铁路机车制动系统技术条件[S]. 北京: 中国铁道出版社,2020.
- [14] 中华人民共和国国家质量监督检验检疫总局. GB/T25122.1-2010 铁路机车车辆车轴设计与强度计算方法[S]. 北京: 中国标准出版社,2010.
- [15] 赵晓伟,祝智庭, 沈书生. 教育提示语工程:构建数智时代的认识论新话语[J]. 中国远程教育,2023(11):22-31.
