期刊文章

比较不同的响应时间阈值设置方法,以检测大规模评估的低工作量

2021年4月

发表在:

大规模教育评估9,8 https://doi.org/10.1186/s40536 - 021 - 00100 - w

由:詹姆斯Soland梅根Kuhfeld约瑟夫·里奥斯


摘要

考生努力程度低是许多考试成绩有效使用的主要威胁。幸运的是,已经开发了几种方法来检测不费力的项目响应,其中大多数使用响应时间。为了准确地识别不费力的响应,必须设置响应时间阈值,将这些响应与努力的人。虽然其他研究比较了不同阈值设置方法的有效性,但他们通常使用模拟或小规模数据进行研究。在此类研究中使用大规模数据时,它们通常不是来自计算机自适应测试(CAT),只使用少数几个项目,或者没有全面检查不同的阈值设置方法。在这项研究中,我们使用了来自美国2056所学校的728,923名3 - 8年级学生的阅读测试成绩,采用了由近12,000个项目组成的CAT来比较阈值设置方法。在这样做的过程中,我们帮助为大规模评估的开发人员和管理员提供指导,这些评估涉及到使用给定的方法来识别不费力的响应所涉及的权衡。

查看更多

访问期刊

本文发表于NWEA之外。全文可以在上面的链接中找到。

相关的话题