数据驱动的高中数学表现性评价实践研究

米粒; 朱梓鑫

当前位置：首页 > 全球教育视角 > 数据驱动的高中数学表现性评价实践研究

全球教育视角

Global Education Perspective

主办单位:
未來中國國際出版集團有限公司
ISSN:
3079-3580（P）
ISSN:
3080-079X（O）
期刊分类:
教育科学
出版周期:
月刊
投稿量:
2
浏览量:
360

数据驱动的高中数学表现性评价实践研究

Data-Driven Practical Research on Performance Assessment of Senior High School Mathematics

发布时间：2026-03-05

作者: 米粒,朱梓鑫 :重庆三峡学院数学与统计学院重庆;

摘要: 针对当前高中数学评价中重结果、轻过程，难以有效评估学生数学思维与综合素养的问题，本研究构建了一套基于数据挖掘的高中数学表现性评价体系。通过系统收集学生在数学建模、探究性课题、解题说理等各类数学表现性任务中的过程性与结果性数据，将其分解为可定性或定量评估的多维能力指标。利用聚类分析、主成分分析、时序建模等数据挖掘与深度分析技术，生成学生个体与群体的能力画像，优化个性化学习路径，并驱动教师进行精准教学干预。实践表明，该评价体系能有效实现“教”与“学”的双向反馈与同步提升，为培育学生数学核心素养提供了可操作的实践路径。

Abstract: In response to the current issues in high school mathematics assessment, which focus more on results than processes and struggle to effectively evaluate students' mathematical thinking and overall competence, this study develops a performance-based evaluation system for high school mathematics based on data mining. By systematically collecting both process-oriented and outcome-oriented data from various mathematical performance tasks, such as mathematical modeling, exploratory projects, and problem-solving reasoning, the data are decomposed into multidimensional competency indicators that can be qualitatively or quantitatively assessed. Using data mining and in-depth analysis techniques such as cluster analysis, principal component analysis, and time-series modeling, individual and group competency profiles are generated to optimize personalized learning pathways and enable teachers to conduct precise instructional interventions. Practice shows that this evaluation system effectively achieves bidirectional feedback and synchronous improvement in both teaching and learning, providing a practical approach for cultivating students' core mathematical competencies.

关键词: 数据挖掘；表现性评价；精准教学干预

Keywords: data mining; performance evaluation; precision teaching intervention

引言

随着我国教育迈向高质量发展的新阶段，《普通高中数学课程标准（2017年版）》明确提出以数学核心素养为导向的教育目标，标志着高中数学教育的目标正从知识传授向核心素养培育深化，表现性评价因其能有效评估学生在真实情境中的知识应用、逻辑推理、创新思维等高阶能力而备受关注；然而，当前表现性评价的实施面临数据采集零散、分析维度单一、反馈滞后等挑战，其潜力未能充分发挥；随着教育信息化的发展，学生在数学学习过程中留下了大量可被记录与分析的数据痕迹。本文旨在借鉴深度数据分析与数据挖掘技术，构建一个基于数据挖掘的高中数学表现性评价框架，通过对多源、多维数据的深度挖掘，实现对学生数学能力的精准评估与可视化呈现，并形成“评价—诊断—反馈—干预”的教学闭环，推动高中数学教学从“经验驱动”向“数据驱动”转型。

本评价体系的构建，遵循“表现性任务设计为先，数据挖掘分析为用”的原则。表现性评价绝非单纯的数据来源，而是整个体系的价值内核与设计起点。我们首先依据高中数学核心素养，精心设计能激发学生真实思维过程的表现性任务及其评分规则；在此基础上，将学生在任务中产生的复杂表现，解构为结构化、可编码的评价数据。数据挖掘技术的作用，在于对这些已结构化的海量过程性数据进行深度处理、模式识别与可视化呈现，从而放大表现性评价的诊断价值，实现从“评估表现”到“理解学习”的跨越。

一、高中数学表现性评价体系的设计与构建

（一）建设目标

本体系旨在通过强化对高中数学表现性任务的数据采集与深度分析，构建一个数据驱动的评价生态系统。其核心目标是：将学生的数学学习表现科学分解为可观测、可量化的综合能力指标，利用数据挖掘技术，深度诊断学生个体与群体的能力结构与学习短板。基于数据分析结果，为学生提供个性化学习建议，为教师提供精准教学决策支持，最终实现“以评促学、以评促教”的双向赋能，提升教学质量与学生数学素养。

（二）评价指标体系构建

学生在数学建模、项目学习、解题说理等表现性任务中的过程与成果被解构为以下6大能力维度与12项具体指标：

能力1（数学概念理解）通过指标1（核心概念复述准确度）和指标2（概念关联与辨析）评估。

能力2（逻辑推理与运算）通过指标3（推理链条完整性）和指标4（运算过程与结果准确性）评估。

能力3（数学建模与应用）通过指标5（实际问题数学化）和指标6（模型求解与验证）评估。

能力4（思维创新与批判）通过指标7（解法多样性）和指标8（评价与优化他人方案）评估。

能力5（表达与交流）通过指标9（解题说理清晰度）和指标10（报告/展示结构化）评估。

能力6（学习过程管理）通过指标11（任务时间规划与执行）和指标12（反思与订正深度）评估。

各能力维度与指标权重的确定采用德尔菲法，邀请5位高中数学教研专家与10名一线教师进行多轮评议与修订，其中，“数学建模与应用”“思维创新与批判”等指向高阶素养的维度权重设定略高于基础能力维度，以体现对学生综合素养发展的引导。

（三）表现性评价评分规则

教师依据学生的过程性证据，如思路草稿、讨论记录、修改痕迹等，与最终成果进行评分，将12项指标的等级转化为具体分值，构建出高中数学表现性评价评分规则表（表1），该规则作为表现性评价的核心工具，此结构化评分矩阵即为后续数据挖掘与深度分析的精确数据源，实现了从质性表现到量化诊断的闭环。评分规则的制定经过三轮专家审议与试评修订：首轮基于课程标准与文献初步拟定；第二轮邀请3位教研员与8名教师对30份学生作品进行试评，修订表述模糊项；第三轮进行信度检验，确保评分标准清晰可靠。表1中各等级对应的得分区间为：优秀（4分，≥90%）、良好（3分，75%—89%）、合格（2分，60%—74%）、需改进（1分，<60%）。

表1 表现性评价评分规则表

能力维度	评价指标	优秀（4分）	良好（3分）	合格（2分）	需改进（1分）
数学概念理解	概念复述准确度	准确完整阐述，无误	主要内容准确，个别疏漏	部分内容准确，存在混淆	根本错误或无法阐述
数学概念理解	概念关联与辨析	清晰阐述多概念逻辑关系并举例	说明1-2个概念关系，分析待深化	仅指出表面联系，缺乏分析	无法建立联系或理解错误
逻辑推理与运算	推理链条完整性	步骤完整，逻辑严密，推导清晰	基本完整，个别衔接不清	存在跳跃或缺失，连贯性一般	过程混乱，存在根本缺陷
逻辑推理与运算	运算结果准确性	过程规范，结果正确，主动检验	基本规范，结果正确或轻微错误已修正	过程不规范，结果部分错误	过程混乱，结果严重错误
数学建模与应用	实际问题数学化	识别关键变量，假设合理，建模精准	识别主要变量，假设基本合理，建模适当	识别部分变量，假设粗略，建模不完整	难以提取信息，建模失败
数学建模与应用	模型求解与验证	熟练求解，严谨验证，全面评估	正确求解，基本验证，指出优缺点	求解有误，简单验证，分析不足	求解错误或无法验证
思维创新与批判	解题方法多样性	提出≥2种不同解法并比较优劣	提出2种解法，比较不充分	仅1种标准解法或替代法有缺陷	仅套用单一解法
思维创新与批判	评价与优化方案	敏锐发现亮点不足，提出具体优化方案	指出主要优缺点，提出优化方向	评价笼统，缺乏具体建议	评价空洞或无意义
表达与交流	解题说理清晰度	语言准确、逻辑清晰、表达流畅	表述基本清楚，偶有冗余	表述模糊跳跃，需反复询问	表述混乱，难以理解
表达与交流	报告展示结构化	结构完整，层次分明，重点突出	结构基本合理，衔接可优化	结构松散，内容缺失或混乱	缺乏结构，内容堆砌
学习过程管理	任务时间分配合理性	规划合理且严格执行，灵活调整	有规划且大体执行，进度控制待加强	规划不合理或执行不力	缺乏规划或严重偏离
学习过程管理	反思与订正深度	深入分析根本原因，提炼可迁移经验	改正错误并总结部分经验	仅改正错误，无分析总结	无反思或简单抄答案

二、评价体系的实践与应用

为确保所构建的评价体系具备可操作性并能真正服务于教学实践，本章从数据采集与结构化、个体与群体能力诊断、教学效果验证等多个维度展开实践探索。研究基于真实教学场景，结合数据挖掘方法，对学生在表现性任务中的多模态数据进行系统性分析，并在此基础上开展对比实验与持续跟踪，旨在验证该评价体系在提升学生数学核心素养与促进教师精准教学方面的实际效能，形成“评价—诊断—干预—提升”的实践闭环。

（一）学生综合能力数据分析

1. 表现性数据的采集与结构化

学生完成表现性任务后，产生的是丰富的原始表现证据，如文本报告、图表、视频等。依据预先制定的评分规则，由教师对这些证据进行评判，将其转化为12项指标的等级分或分数，例如，对学生的一段解题说理视频进行分析，依据“指标9：解题说理清晰度”，评判其逻辑连贯性、语言准确度，并给出相应得分，此步骤是将质性“表现”量化为可挖掘“数据”的关键环节，确保了后续数据挖掘的对象是扎根于真实学习表现的结构化信息。

2. 学生个人12项指标得分情况

采用简单随机抽样法，选取一名中等学业水平学生作为研究对象，对其在学期内完成的10项表现性任务数据进行SPSS分析。计算每项指标的得分率并用箱线图可视化（图1），分析发现，该生在指标2（概念关联）和指标4（运算准确性）上得分率较高（>90%），而在指标6（模型验证）和指标8（方案优化）上明显薄弱（<70%），结果表明该生具有扎实的基础知识与运算技能，但在应用与创新层面存在短板，建议其加强数学建模与批判性思维的专项训练。

图1 学生各项指标得分率

3. 学生个人6项能力评估

将单项指标得分率按所属能力维度聚合（图2），计算各项能力的优良率（≥85分为优良）。该生在“逻辑推理与运算”能力上优良率达92%，而在“思维创新与批判”能力上优良率仅为55%，数据清晰地揭示了其“强于执行，弱于创新”的能力结构，为后续的个性化辅导提供了明确方向。

图2 学生各项能力评估

（二）学生综合能力提升成效

为验证本评价体系的有效性，在一所高中选取两个平行班，随机设为对照组（常规评价）和实验组（应用数据挖掘的表现性评价），进行为期一学期的准实验研究。

1. 学生成绩有效提升

学期末，通过一项综合性数学建模任务对两组学生进行考核。对学生在数学建模、思维创新、逻辑推理三项核心能力上的表现进行三维PCA分析（图3），在三维主成分空间中，实验组与对照组的学生群体形成了明显分离的两个聚类。实验组学生点云集中分布于PC1、PC2、PC3均为正向的高分值区域，而对照组则多聚集于PC值较低的左下区域。这一空间分布的显著差异，直观揭示了实验组学生在高阶数学能力上的系统性优势。实验组平均分（86.42±2.11）显著高于对照组（78.15±2.85）（P<0.001），证明该评价体系能有效提升学生的综合数学表现，且这种提升源于能力结构的根本性优化。

图3 学生能力有效提升

2. 学生能力结构优化

为深入考察基于数据挖掘的表现性评价体系对学生能力结构的影响，本研究采用热力图（图4）对对照组与实验组学生在12项数学能力指标上的得分进行了系统可视化分析与比较。结果显示：实验组学生在全部12项指标上的表现均显著优于对照组，呈现出整体性的能力提升。特别是在体现高阶思维与创新能力的指标上——如“模型求解与验证”“解法多样性”以及“评价与优化他人方案”——实验组学生的表现提升尤为突出。经量化分析，其效应量均超过0.8，达到了统计学上的大效应水平，这一结果清晰地表明，本研究构建的数据挖掘驱动之表现性评价体系，能够精准、系统地识别学生在数学学习过程中的能力短板与结构特征。更重要的是，依托于此体系所形成的数据反馈与教学干预机制，能够有效引导学生进行针对性训练，弥补其在知识应用、模型构建、策略创新等方面的不足，从而实现了学生数学能力结构的系统性优化与整体素养的显著提升。

图4 学生各项指标有效提升

（三）教师教学效果数据分析

1. 班级学生能力总体评估

以教师所带班级（n=45）为例，统计各项能力达到优良水平的学生比例。班级学生各项指标得分堆积柱状图（图5）直观呈现了班级学生在六项能力维度上的表现分布，班级在“数学概念理解”和“逻辑推理”上优良率分别达到68%和65%，形成较高的柱体；而在“数学建模与应用”和“思维创新”上优良率仅为32%和28%，柱体明显偏低。这种可视化呈现使教师能够一目了然地识别班级的能力结构特征：学生普遍具备较好的基础认知与运算能力，但在知识应用与创新思维方面存在明显短板。该分析促使教师调整教学策略，在后续教学中增加探究性学习任务与开放性问题的比例，实施针对性干预。

图5 班级学生各项指标得分情况

2. 教学效果提升成效

基于数据挖掘的表现性评价不仅提升了学生成绩，也促进了教师教学能力的专业化发展。通过边对边小提琴图（图6）对比了实验组与对照组在三次学评教中的分数变化：第一次评教时，两组的小提琴形状基本重叠，分数分布相似；第二次评教时，实验组的小提琴整体上移，形状更为饱满；第三次评教时，实验组的小提琴进一步上移且形态更加挺拔集中，而对照组的小提琴虽略有上移但仍保持较低且扁平分散的形态。这种动态可视化清晰地展示了实验组学生满意度持续、稳定、显著的提升过程。同时，学生月考平均成绩也呈现同步增长，成绩增长率分别为9.1%（P=0.022）、7.8%（P=0.015），这种“教学相长”的良性循环，正是基于数据挖掘的表现性评价体系通过精准诊断、及时反馈所达成的核心价值——既优化了学生的学习路径，也驱动了教师教学策略的持续改进。

图6 学生成绩及评教分数变化

三、结语

本研究构建并实践了一个以表现性评价为核心、以数据挖掘为增强工具的高中数学评价体系。其根本创新在于，通过精心设计的表现性任务与评分规则，首先保证了所评价的是学生在真实情境中的数学思维与核心素养；进而，利用数据挖掘技术对大规模、多维度、过程性的评价数据进行深度分析，实现了诊断的精准化、可视化与干预的即时化。实践证明，表现性评价与数据挖掘的深度融合，不仅解决了传统表现性评价“分析难、反馈慢”的瓶颈，更避免了单纯数据驱动评价可能导致的“去情境化”与“价值空心化”风险。未来，我们将在以下方面继续深化研究：一是进一步优化表现性任务的设计，增强其与高中数学核心素养的对应性；二是探索基于自然语言处理与计算机视觉的智能评分辅助工具，提高评价的自动化与客观性；三是构建个性化学习路径推荐系统，实现更精准的学习干预；四是拓展评价数据的跨学期追踪与分析，探索学生数学能力发展的长期规律。

本研究仅为初步尝试，期待通过持续探索，让人工智能技术更好地服务于揭示与促进人的复杂思维表现这一根本教育目标。最终目标是构建个性化学习路径推荐系统，实现更精准的学教干预，让技术更好地服务于人的思维发展。

参考文献：

[1] 许晓莉.核心素养下的高中数学课堂教学策略研究[J].教育理论与实践,2024,44(02):59-61.
[2] 中华人民共和国教育部.普通高中数学课程标准（2017年版）[M].北京:人民教育出版社,2018.
[3] 陈瑞生.表现性评价的任务开发:特征、原则与步骤[J].教育测量与评价(理论版),2010(04):4-7.
[4] 杨燕飞.表现性评价在初中数学“综合与实践”活动中的应用研究[D].鲁东大学,2020.
[5] 郑勤华,陈丽,柴唤友,等.基于信息技术的表现性评价:内涵、作用点与发展路向[J].中国电化教育,2023(03):55-61.
[6] 谢郭茹.数据挖掘技术在教育领域的应用[J].科技和产业,2014,14(09):121-124+139.
[7] 斯特凡·斯莱特,斯万克·约克西莫维奇,维特梅·科万诺维奇,等.教育数据挖掘工具综述[J].开放学习研究,2018,23(01):37-47.
[8] 宋博,吕云震.论数据挖掘对比较教育研究的影响[J].黑龙江高教研究,2020,38(04):87-90.
[9] 彭亚,于翠波,张勖.教育数据挖掘技术应用研究[J].中国教育技术装备,2017(18):1-5+13.

全球教育视角

Global Education Perspective

相关文章

数据驱动的高中数学表现性评价实践研究

Data-Driven Practical Research on Performance Assessment of Senior High School Mathematics

引言

一、高中数学表现性评价体系的设计与构建

（一）建设目标

（二）评价指标体系构建

（三）表现性评价评分规则

二、评价体系的实践与应用

（一）学生综合能力数据分析

1. 表现性数据的采集与结构化

2. 学生个人12项指标得分情况

3. 学生个人6项能力评估

（二）学生综合能力提升成效

1. 学生成绩有效提升

2. 学生能力结构优化

（三）教师教学效果数据分析

1. 班级学生能力总体评估

2. 教学效果提升成效

三、结语

参考文献：