
教育创新与实践
Journal of Educational Innovation and Practice
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3599(P)
- ISSN:3080-0803(O)
- 期刊分类:教育科学
- 出版周期:月刊
- 投稿量:5
- 浏览量:437
相关文章
暂无数据
中考英语阅读试题内容效度研究——以重庆2024年中考A、B卷为例
Research on the Content Validity of the English Reading Questions in the Senior High School Entrance Examination - Taking the 2024 Senior High School Entrance Examination Paper A and B of Chongqing as an Example
引言
在基础教育领域,中考意义重大,兼具学业水平评估与人才选拔功能。其中,阅读部分在中考英语中占比较大,对评估学生语言综合运用能力举足轻重。2022年颁布的《义务教育英语课程标准》围绕核心素养,明确了初中英语教学与测试方向,为中考英语阅读命题提供重要依据。分析2024年重庆中考A、B卷阅读试题内容效度,有助于了解命题质量,为优化教学与测试、提升学生英语阅读素养提供参考。
一、文献综述
内容效度研究
国内内容效度研究
国内研究主要为两类。一种是各类英语测试内容效度:早期以大学英语测试为主,近年转移至中学。例如,穆惠峰(2011)基于语料库分析方法对大学英语四级考试完型填空部分的内容效度进行了实证研究另外一种是具体题型的内容效度,此分类涉及有阅读、完形填空书面表达等,研究者们通常进行历时研究。谭珍(2018)从书面表达题型对湖南省中考英语的内容效度进行历时研究。陈宇博(2024)基于Bachman和Palmer的测试任务特征框架对2020—2023年英语全国卷的听力部分进行了解析。
国外内容效度研究
20世纪50年代至80年代中期美国心理学会(APA)划分内容效度、预测效度、共时效度和结构效度。1985年APA《教育与心理测试标准》提出效度为综合概念,以结构效度为核心。Hughes(2000)认为内容效度体现为测试是否覆盖考试说明中的语言技能,Bachman(1990)则强调内容的相关性与覆盖性是关键。国外研究如Jusoh et al.(2018)通过“题目-目标一致性”方法验证阅读测试的内容效度,证实其对试卷质量的决定性作用。
理论基础
-
效度及内容效度
Bachman(1990)提出内容相关性和内容覆盖率。Messick(1989)进一步提出,效度是指从经验数据及其理论基础出发,全面评估基于测验得分或其他形式评估的结论或行动所获得支持的良好和充分度。
王雪晴和黄良广(2009)指出,“测试内容是否是其所要测试内容的有效样本”是内容效度的关键;同时提出,试题编制需紧扣大纲纲要,通过大纲与试题内容的对比,可据此判断内容效度高低。胡中锋和莫雷(2007)提出,效度是指测量结果与其预期目标之间的一致度。
黄光扬(2012)在《教育测量与评价》中表明,效度实质上是指测量的实际效力,即测验或量表的测量结果是否符合预期,从而准确地反映所需度量的程度。
二、研究设计
研究问题
本文依据《义务教育课程标准(2022版)》要求,以2024年重庆市中考英语A和B卷中的阅读理解题目为研究对象。旨在回答以下问题
1.2024年,重庆市中考英语阅读测试的内容效度如何?
2.2024年重庆市中考英语阅读测试内容的主要特征是什么?
研究对象
本研究选取重庆市2024年中考英语阅读理解A和B卷解测试部分作为研究对象,共10篇文章,38道试题。基于2022年版本的义务教育英语课程标准和语言测试任务特征框架,对阅读理解试题数据分析的基础上,总结重庆市2024年中考英语阅读测试的内容效度以及其内容效度优化路径,力求为中考英语命题者、一线教师以及学生等提供反馈与建议。
研究方法
本文将采纳Bachman&Palmer(1996)所提出的理论框架为研究方法。Bachman和Palmer提出的任务特征框架有五个部分:测试说明、测试环境、语篇输入、预期回语篇输入和预期回答。具体内容见表1。
| 项目 | 内容 |
|---|---|
| 情境特征 | 物质特征 |
| 参与者 | |
| 任务时限 | |
| 测试规则特征 | 说明 |
| 结构 | |
| 答题时间 | |
| 评分方法 | |
| 输入特征 | 形式 |
| 输入的语言 | |
| 期望回答特征 | 形式 |
| 期望回答的语言 | |
| 输入与回答关系 | 反应 |
| 范围 | |
| 直接程度 |
为了研究英语阅读理解的测试有效性,本文以Bachman和Palmer的语言测试任务框架为基础,结合并修改田恋(2024)提出的内容效度分析框架《课标》(2022)进行实证分析,见表2。
| 项目 | 内容 |
|---|---|
| 语篇输入特征 | 词汇量及生词量 |
| 易读度 | |
| 题材 | |
| 体裁 | |
| 预期回答特征 | 题型 |
数据收集与分析
词汇量及生词量
根据所进行的统计分析得出,2024年重庆中考英语阅读试题生词量的分布情况已呈现在表中。生词是指未包含在《课标》(2022)版中的词汇表范围之内的,见表3。
| 项目 | 生词量 | 文章合计词量 | 生词率 |
|---|---|---|---|
| A卷 | 20 | 1586 | 1.26% |
| B卷 | 20 | 1328 | 1.5% |
刘润清、韩宝成(2004)提出,中国大型英语考试的英语词汇量要求是阅读材料中的词汇量应少于2%。2024年重庆中考英语A卷阅读总词量为1586词,生词量20个,生词率1.26%;B卷总词量1328词,生词量20个,生词率1.5%。两卷生词率均显著低于2%,表明命题者对词汇范围的把控严格符合课标要求。从文本长度看,A卷单篇平均词量约317词,B卷约266词,差异可能源于题材复杂度(如A卷E篇“科学与技术”需更多专业表述)。生词的分布上,两卷均未出现集中高频生词群,且生词多为派生词或语境可推断词汇(如通过前缀、后缀或上下文逻辑),既避免因词汇障碍过度影响理解,又适度考查学生的词汇学习策略与语境推断能力,符合“在语境中考查语言运用”的测试理念。
易读度
1948年,据Flesch提出,其开发的易读性评价公式广泛应用于文本可读性的量化分析。该模型主要通过量化文章中的词汇数量与句子长度,以此来衡量文本在句法结构与语言表达上的复杂性。目前,微软Office Word等文本编辑工具已经集成了相关的评价功能。易读性评分介于0至100的区间变化,分数越低,意味着文本的可读性越差。以下表格根据Flesch的研究,归纳了易读度评分与文本可读性的对应关系,见表4。各篇易读度统计情况见表5和表6。
| 易读度指数 | 可读性水平 |
|---|---|
| 0-30 | 非常难 |
| 30-50 | 难 |
| 50-60 | 较难 |
| 60-70 | 标准 |
| 70-80 | 较容易 |
| 80-90 | 容易 |
| 90-100 | 很容易 |
| 文章编号 | 易读度 | 可读性水平 |
|---|---|---|
| A | 72.8 | 较容易 |
| B | 71.1 | 较容易 |
| C | 68.6 | 标准 |
| D | 74.9 | 较容易 |
| E | 68.9 | 标准 |
| 文章编号 | 易读度 | 可读性水平 |
|---|---|---|
| A | 82.7 | 容易 |
| B | 55.1 | 较难 |
| C | 47.2 | 难 |
| D | 95.7 | 很容易 |
| E | 69.9 | 标准 |
依据Flesch易读度指数,A卷整体呈现“标准—较容易”水平(68.6-74.9),其中4篇达“较容易”(70-80),仅C篇(68.6)为“标准”,表明A卷文本在句子长度、句法复杂度上控制均衡,适合多数学生的阅读流畅度需求。B卷则呈现显著分化:D篇(95.7,“很容易”)和A篇(82.7,“容易”)因句式简单、主题贴近生活(如“历史文化”“做人与做事”),可读性极高;而B篇(55.1,“较难”)和C篇(47.2,“难”)因涉及“社会服务”等抽象主题及复杂长句结构,导致易读度骤降。这种“两极化”设计可能旨在区分不同水平学生的阅读能力,但需注意复杂文本的比例(B卷中“较难”及以上占40%)是否超出课标对初中生阅读难度的预期,建议通过调整长句拆分、增加过渡词等方式优化高难度文本的可读性。
题材
义务教育英语课程标准2022年版中主题内容要求(三级)围绕“人与自我”“人与社会”“人与自然”三大范畴展开,涵盖丰富的子主题及具体内容,为英语教学和学习提供了明确方向,具体内容见表7和表8。
| 文章顺序编号 | 主题范畴 | 主题群 |
|---|---|---|
| A | 人与社会 | 历史、社会与文化 |
| B | 人与自然 | 自然生态与环境保护 |
| C | 人与社会 | 历史、社会与文化 |
| D | 人与自我 | 生活与学习 |
| E | 人与社会 | 科学与技术 |
| 文章顺序编号 | 主题范畴 | 主题群 |
|---|---|---|
| A | 人与社会 | 历史、社会与文化 |
| B | 人与自我 | 生活与学习 |
| C | 入与社会 | 社会服务于人际沟通 |
| D | 人与自我 | 做人与做事 |
| E | 人与自然 | 自然生态与环境保护 |
两卷题材严格遵循课标“人与自我”“人与社会”“人与自然”三大范畴,但具体分布存在差异。A卷:以“人与社会”为核心(3篇,占60%),涵盖“历史、社会与文化”(A、C篇)和“科学与技术”(E篇),体现对社会认知与科技素养的重视;“人与自然”(B篇)和“人与自我”(D篇)各1篇,比例均衡。B卷:“人与社会”(2篇)与“人与自我”(2篇)并重,新增“社会服务与人际沟通”(C篇)这一实践性主题,凸显对学生社会交往能力的考查;“人与自然”(E篇)仅1篇,与A卷共同反映生态环保主题的考查力度不足(两卷合计仅2篇)。
整体来看,题材选择紧密联系学生生活(如A卷D篇“生活与学习”、B卷B篇“生活与学习”)和社会热点(如科技发展、历史文化传承),但“人与自然”主题占比偏低,建议后续命题增加生态保护、可持续发展等题材,强化“人与自然和谐共生”的核心素养培育。
体裁
体裁可分为记叙文、说明文、应用文等,具体内容见表9和表10。
| 文章顺序编号 | 体裁类型 |
|---|---|
| A | 应用文 |
| B | 说明文 |
| C | 记叙文 |
| D | 记叙文 |
| E | 说明文 |
| 文章顺序编号 | 体裁类型 |
|---|---|
| A | 应用文 |
| B | 说明文 |
| C | 说明文 |
| D | 记叙文 |
| E | 记叙文 |
A卷体裁呈现多元特征:应用文(A篇,如通知、广告)、说明文(B、E篇,如环保说明、科技介绍)、记叙文(C、D篇,如人物故事、生活叙事)各有分布,覆盖信息检索、知识获取、情感体验等多元阅读功能。B卷则以说明文(B、C篇)和记叙文(D、E篇)为主,应用文仅1篇(A篇),且未涉及议论文。这种体裁分布反映命题者对基础阅读能力(如事实提取、细节理解)的侧重,但议论文的缺失可能导致批判性思维考查不足。根据课标“发展学生逻辑思维与辩证能力”的要求,建议适当引入议论文体裁(如观点辨析、现象评论),以完善体裁多样性,全面考查不同文本类型的阅读策略。
题型
英语阅读理解测验可涵盖词义辨析题、鉴别题、说明题、细节题、判断评估题、推理论证题等(Alderson&Lukmani,1989)。立足于2022年版本的《课程标准》,本项研究对重庆市中考英语2014年中考英语A、B卷在阅读理解部分的题型进行了梳理和分析,见表11和表12。
| 文章编号 | 题号 | 题型 |
|---|---|---|
| A | 41-43 | 图片匹配题 |
| B | 44 | 细节理解题 |
| 45 | 观点态度题 | |
| 46 | 细节理解题 | |
| 47 | 归纳概括题 | |
| C | 48 | 主旨大意题 |
| 49 | 细节理解题 | |
| 50 | 代词指代题 | |
| 51 | 推理判断题 | |
| D | 52 | 细节理解题 |
| 53 | 细节理解题 | |
| 54 | 推理判断题 | |
| 55 | 主旨大意题 | |
| E | 56 | 写作意图题 |
| 57 | 词义猜测题 | |
| 58 | 篇章结构题 | |
| 59 | 推理判断题 |
| 文章编号 | 题号 | 题型 |
|---|---|---|
| A | 41-43 | 图片匹配题 |
| B | 44 | 细节理解题 |
| 45 | 细节理解题 | |
| 46 | 细节理解题 | |
| 47 | 细节理解题 | |
| C | 48 | 细节理解题 |
| 49 | 词义猜测题 | |
| 50 | 主旨大意题 | |
| 51 | 推理判断题 | |
| D | 52 | 细节理解题 |
| 53 | 推理判断题 | |
| 54 | 推理判断题 | |
| 55 | 情感态度题 | |
| E | 56 | 细节理解题 |
| 57 | 写作手法题 | |
| 58 | 图表匹配题 | |
| 59 | 篇章结构题 |
细节理解题:A卷9题(占47.4%),B卷10题(占62.5%),均为最主要题型,侧重考查信息定位与直接提取能力,符合中考“基础性”考查定位。高阶思维题型:A卷涵盖推理判断(3题)、主旨大意(2题)、观点态度(1题)等7类高阶题型,其中“图片匹配题”(3题)通过图文转换考查可视化信息处理能力,“篇章结构题”(1题)关注文本逻辑分析,体现对综合阅读能力的挖掘;B卷高阶题型仅4题(推理判断3题、情感态度1题),题型多样性不足,且对“归纳概括”“写作意图”等能力考查缺失。值得注意的是,A卷通过“词义猜测题”(1题)和“代词指代题”(1题)考查词汇语境运用与语篇衔接理解,B卷则通过“图表匹配题”(1题)创新性考查信息结构化处理能力。但两卷在“批判性思维”题型(如观点评价、文本反驳)上均为空白,未来可探索设置“作者观点合理性分析”“不同视角对比”等题型,以深化对高阶思维的考查。
结果与讨论
命题特征分析
从词汇与文本难度角度,2024年重庆中考英语A、B卷阅读试题生词率分别为1.26%和1.5%,生词多为语境可推断词汇(如派生词、专有名词),体现命题对“可理解性输入”原则的遵循。A卷总词量(1586词)高于B卷(1328词),但易读度整体更均衡(68.6-74.9,“标准—较容易”);B卷呈现“两极化”特征,D篇(95.7,“很容易”)与C篇(47.2,“难”)差异显著,反映命题者试图通过文本复杂度区分学生能力,但部分高难度文本可能超出初中生平均认知水平。
题材与体裁的选择性覆盖。题材方面,试题严格遵循课标三大范畴,“人与社会”主题占比最高(A卷3篇、B卷2篇),涉及历史文化、科学技术等,贴近社会实际;但“人与自然”主题仅2篇,生态环保类文本不足,未能充分体现课标对“绿色发展理念”的培养要求。体裁视角,试题以说明文(A卷2篇、B卷2篇)和记叙文(A卷2篇、B卷2篇)为主,A卷含1篇应用文(信息检索),但两卷均未涉及议论文,体裁多样性不足,导致批判性思维考查路径缺失。此外,题型设计方面,细节理解题占比超50%(A卷9题、B卷10题),侧重基础信息提取能力,符合中考“水平性考试”定位;A卷高阶题型更丰富(如推理判断、篇章结构、图片匹配),注重综合阅读策略考查;B卷题型单一,高阶思维题仅4题,且未涉及归纳概括、写作意图等维度,能力考查广度不足。
内容效度
从测试任务特征框架看,试题在输入特征与期望回答特征上与课标存在部分契合与偏差。
首先,输入特征方面。词汇与文本:生词率低,文本长度与易读度整体符合初中生认知水平(A卷均衡,B卷部分文本过难),但“人与自然”题材占比不足(仅10%),未能充分覆盖课标“三大主题”的完整性要求,影响内容效度的“覆盖性”。
体裁局限:缺乏议论文体,无法评估学生对观点论证、逻辑推理等高阶阅读能力的掌握,导致输入特征的“多样性”不足,削弱了测试对课标能力要求的全面映射。
其次,期望回答特征。题型分布:细节理解题占比过高(A卷47.4%、B卷62.5%),虽符合基础能力考查需求,但推理判断、主旨概括等题型占比偏低(A卷15.8%、B卷18.8%),且未设置观点评价类题目,难以验证学生是否达成课标“发展批判性思维”的目标,内容效度的“相关性”受限。
三、结论
2024年重庆市中考英语 A、B 卷的阅读理解试题整体内容效度良好:从语篇选材来看,试题覆盖记叙文、说明文、应用文等课标要求的核心文体,题材贴合学生生活、跨文化交流及科技环保等时代主题,符合《义务教育英语课程标准(2022 版)》对阅读能力的层级要求;从题型设计而言,细节理解、主旨归纳、推理判断等题型配比基本适配课标对不同能力层级的考查导向,能够有效检测学生的英语阅读核心素养。不过,试题仍存在进一步优化的空间,如部分语篇的语境创设可更贴近真实语言使用场景等等,以更好地发挥试题对英语教学的反拨作用,全面落实课标的核心目标。
参考文献:
- [1] Bachman L F. Fundamental Considerations in Language Testing[M]. Oxford: Oxford University Press, 1990.
- [2] Bachman L F. & Palmer A S. Language Testing in Practice[M]. Shanghai: Shanghai Foreign Language Education Press, 1996.
- [3] Hughes A. Testing for English Language Teachers[M]. Beijing: Foreign Language Teaching and Research Press, 2000.
- [4] Messick S. Validity[C]. In R. L. Linn (Ed.), Educational Measurement (3rd ed.). New York: American Council on Education and Macmillan, 1989.
- [5] O'Reilly, Tenaha Feng, Gary Sabatini John, et al. How do people read the passages during a reading comprehension test? The effect of reading purpose on text processing behavior[J].Educational Assessment,2018,23(04):277-295.
- [6] 陈宇博.“三新”背景下高考英语听力测试内容效度研究——以2020—2023年英语全国卷为例[J].教育测量与评价,2024(01):83-96.
- [7] 韩宝成,刘润清.我国基础教育阶段英语教育回眸与思考(一)——政策与目的[J].外语教学与研究,2008(02):150-155+161.
- [8] 胡中锋,莫雷.心理与教育测量中效度理论的重建[J].华南师范大学学报(社会科学版),2007(06):82-90+159-160.
- [9] 穆惠峰.基于语料库的大学英语四级完型填空测试内容效度验证研究[J].外语电化教学,2011(04):66-70.
- [10] 谭珍.湖南省中考英语书面表达内容效度历时研究(2015—2017)[J].教育测量与评价,2018(05):43-50.
- [11] 田恋.重庆市中考英语阅读测试的内容效度研究[D].西南大学,2024.
- [12] 王瑞珍,黄光扬.中国高考需松绑——慎言高考造成学生课业负担过重[J].教育测量与评价(理论版),2008(05):43-45+63.
- [13] 王雪晴,黄良广.语言测试中的效度与效度理论[J].内蒙古农业大学学报(社会科学版),2009,11(06):131-133.
- [14] 肖维维.新课程改革背景下中考英语阅读理解试题的内容效度研究[D].重庆师范大学,2023.
- [15] 张兆川.《义务教育英语课程标准(2022版)》背景下的英语阅读理解试题内容效度分析[D].西南大学,2023.
- [16] 中华人民共和国教育部.《义务教育英语课程标准(2022年版)》[S].北京:北京师范大学出版社,2022.
