使用重测数据评估和改进努力调节评分(NWEA)

演讲

使用重测数据评估和改进努力调节评分

2020年9月

描述

本次会议来自2020年全国教育测量委员会虚拟会议，介绍了关于理解和管理考试不参与的新研究发现(报告于22:55开始)。

Wise, S.， & Kuhfeld, M.(2020年9月)。使用重测数据评估和改进努力调节评分。全国教育测量委员会虚拟会议。

越来越多的人研究如何管理考试时的疏离感。一些研究集中在根据快速猜测的影响调整分数的方法上，这是一个有效的脱离项目反应指标。一个例子是努力调节(E-M)模型(Wise & DeMars, 2006)，在该模型中，快速猜测被识别并排除在评分过程中。E-M评分旨在评估一个心不在焉的考生在完全投入的情况下所能获得的分数。尽管评估E-M评分调整的准确性具有挑战性，但我们开发了一个独特的数据集，允许进行这样的评估。

研究1分析了一个数据集，该数据集基于MAP增长评估的数学和阅读存档的ritt分数数据，这些数据来自于在短时间内重新测试的学生。这使得我们能够研究E-M评分的准确性。通过两个测试术语，学生在一天内被重新测试的实例被确定。在这一组中，发现超过5000例学生在第一次测试中表现出脱离(10%以上的快速猜测)，而在重新测试中没有快速猜测。表1显示E-M评分部分解释了观察到的RIT评分差异。

研究2将调查，使用相同的数据集，一种改善E-M评分准确性的净化方法。具体来说，我们将调查使用各种次级时间阈值来识别E-M评分期间排除的反应。本文提出的E-M评分方法可以提高对考生脱离考试的分数失真的估计能力，从而提高E-M评分的价值。

看到报告

主题:学校和测试的参与，测量及扩展