相关话题
适应性评估的潜力
在本文中,作者解释了猫如何通过调整测试在测试所在的问题来提供更精确的,准确的绩效,准确地了解了低实现和高位学生的成就水平。即时,信息性的测试结果使教师能够区分指导,以满足个别学生当前的学术需求。
经过:G. Gage Kingsbury那Mike Nesterak,MA那爱德华弗里曼
纽约的学生成就幻影崩溃
当纽约国家在共同的核心国家标准下发布了考试的第一次结果时,许多人错误地认为,结果表明学生成就下降了剧烈下降。仔细看看结果表明,学生成就可能会增加。
经过:约翰·克里诺那Nate Jensen.
话题:测量和缩放
适应性测试在解决无动机考生问题时的效用
这种综合审查研究了计算机适应性测试(CAT)的动机益处,并表明它们在考生表现出低努力时,它们可以对识别实例的常规测试具有重要优势,并有效地解决未激励考生所带来的有效性威胁。
经过:史蒂文明智
倾向使用多级模型进行分类分层,以检查包机学校成就效应
特别是特别辩论是将传统公立学校转移到一个关于学生成就和增长的宪章学校的影响。我们采用倾向得分分层和多级模型来平衡学生跨州样本的治疗和对照组之间的关键协变量,在准实验背景下提供了更复杂的宪章学校成就效应。
经过:Beth Tarasawa.那云翔
话题:测量和缩放那学生成长与问责制政策
评估计算机自适应测试中的内容对齐
本文介绍了在猫的发展中产生的决定,可能会威胁到内容对齐。它概述了评估对对齐对这些威胁敏感的对齐的过程,并给出了该过程的经验例子。
经过:史蒂文明智那G. Gage Kingsbury那诺曼韦伯
话题:测量和缩放
努力分析:各个成绩测试数据的分数验证
每当测量目的是通知学生的成就水平的推论时,重要的是,我们能够相信学生的测试分数准确地反映了学生知道和可以做的事情。这种信任需要假设学生的测试事件不会受到可能扭曲他得分的构建无关因素的过度影响。本文审查了一种如此因素试验 - 采取的动机 - 倾向于诱导特定人的系统性负面偏见测试评分。
经过:史蒂文明智
建模学生在自适应成就测试的背景下进行测试动机
本研究检测了响应时间的分析在理解未激动的考试者的行为方面的效用。对于自适应成就测试,将观察到的快速猜测行为和项目响应精度的模式与已提议的几种模型的预期的行为进行比较,这提出了代表未激励的测试采取行为。