使用重测数据来评估和改进努力调节评分- NWEA

演讲

使用重测数据来评估和改进努力调节得分

2020年9月

描述

2020年全国教育测量委员会虚拟会议的本次会议介绍了关于理解和管理考试脱离感的新研究成果(演讲于22:55开始)。

Wise, S.， & Kuhfeld, M.(2020, 9月)。使用重测数据来评估和改进努力调节得分。全国教育测量委员会虚拟会议。

关于如何管理考试分心的研究越来越多。一些研究集中在调整快速猜测得分的方法上，快速猜测是一种有效的非投入项目反应指标。一个例子是努力调节(E-M)模型(Wise & DeMars, 2006)，在该模型中，在评分过程中识别并排除快速猜测。E-M评分是为了估计一个不参与的考生在他们完全参与的情况下会收到的分数。尽管评估E-M分数调整的准确性具有挑战性，但我们开发了一个独特的数据集，允许进行此类评估。

研究1分析了一个数据集，该数据集基于在短时间内重新测试的学生在数学和阅读方面的MAP增长评估中存档的rit分数数据。这使我们能够研究E-M评分的准确性。在两个测试学期中，发现了学生在一天内重新测试的情况。在这一组中，发现了超过5000个案例，其中学生在第一次测试中表现出不投入(10%+快速猜测)，在第二次测试中表现出零快速猜测。表1显示，E-M分数部分解释了观察到的RIT分数差异。

研究2将使用相同的数据集，研究一种提高E-M评分准确性的纯化方法。具体地说，将研究使用各种次要时间阈值来识别在E-M评分中被排除的反应。新方法有望提高我们估计因脱离考试而导致的分数失真的能力，从而提高E-M评分的价值。

请看演示

主题:测量与标度,学校和考试参与度