比较不同响应时间阈值设置方法检测大规模评估的低努力

杂志文章

比较不同响应时间阈值设置方法以在大规模评估上检测低努力

4月2021年4月

出版于：

教育大规模评估9，8 https://doi.org/10.1186/s40536-021-00100.

抽象的

低考生努力是对许多测试分数有效使用的主要威胁。幸运的是，已经开发了几种方法来检测非违法的项目响应，其中大部分使用响应时间。要准确识别非违法的响应，必须设置分离这些响应的响应时间阈值努力。虽然其他研究已经比较了不同阈值设置方法的功效，但它们通常使用模拟或小规模数据来这样做。当在这些研究中使用大规模数据时，它们通常不是计算机自适应测试（CAT），仅使用少数项目，或者不全面检查不同的阈值设置方法。在这项研究中，我们在美国的2,056所学校中使用读取测试分数来自美国的2,056所学校，占据了一只近12,000个项目来比较阈值设置方法。在这样做时，我们帮助向开发商和管理员提供关于使用给定方法识别无违法反应的权衡的大规模评估的指导。

访问期刊

本文发表于NWEA之外。全文可以在上面的链接找到。

话题：学校和测试参与