衡量增长和理解负增长

衡量增长和理解负增长作为NWEA的一名研究人员,我经常回答关于如何测量和解释增长的问题学业进步测量(MAP®)评估.用MAP测量学生的成长很像用皮尺测量身高的成长。一个学生测量一次,然后在一段适当的时间后,再测量一次。如果学生的测量身高(或MAP分数)在这段时间内发生了变化,那么这种变化就被解释为生长。

然而,在MAP上测量增长的另一个层面是,MAP分数与测量标准误差(或sem)一起报告,这传递了测量分数的误差范围。例如,如果我秋季的RIT分数是214 (SEM = 3.2),那么我的“真实分数”可能会比214低一点或高一点。可能是在214±3.2的范围内,但我不知道确切的位置。再想象一下,如果我的冬季RIT成绩是212分,SEM是3.1分。同样的,“真实得分”也不能确切知道,但它可能在212±3.1的范围内。

那么,我长大了吗?简单的答案是,我失去了2分的RIT,因为我在冬季和秋季测量的分数之间的差距是-2分。但既然观察到的分数有误差范围,那么我观察到的损失也一定有误差范围。

正如NWEA报告显示了与每个测量分数相关的sme,因此,他们也提供了与测量增长相关的标准误差。生长标准误差与个体得分sem相关,因此生长标准误差越小,生长标准误差越小。在上面的例子中,我的增长标准误差计算为,√3.2²+ 3.1²大约4.46。这意味着我的“真正增长”很可能在-2±4.46之间,或者在-6.46和2.46的RIT点之间。

这可以用一个钟形曲线来直观地表示,如下图所示,其中红色阴影区域表示观测到的变化周围的±1标准误差的范围(垂直线为-2):

图1 - NWEA

钟形曲线显示了我“真正成长”的可能结果范围。红色阴影区域占钟形曲线下总面积的68%,换句话说,我们可以68%地确定我的“真实增长”在这个范围内。但我的“真正增长”实际上是正增长的可能性有多大?从视觉上看,它可能是这样的:

图2 - NWEA

这个红色阴影区域(约占曲线下总面积的33%)表示我的“真实增长”大于零的可能性。换句话说,尽管我的观察分数下降了两分,但我的“真实分数”实际上有33%的几率提高了。我的“真实增长”也有67%的可能是负的。

这些信息在很多方面都很有用。首先,它强调了MAP增长包含测量误差元素的事实,这可以用概率表示。在上面的例子中,我们看到我的“真实”成长分数有33%是积极的(或者我进步了),67%是消极的(也就是说,我的真实分数下降了)。当然,对于所有的评估,这些类型的陈述都是可能的,但是对于MAP,与固定形式或较短长度的自适应测试相比,大多数学生的误差幅度是相对较小的。误差越小,我们就能越精确地测量少量的真实学生增长。

另一个有用的原因是,它有助于正确理解和解释负增长。在我上面的例子中,相对于生长标准误差,观察到的变化(-2点)很小。这意味着有相当大的不确定性(约33%的可能性),观察到的损失不是真实的。一般来说,当观察到的变化相对于它们的标准误差非常大时,我们可以更加确信它们是真实的,而不仅仅是测量误差的人工制品。当变化相对于它们的标准误差很小时,我们对它们的真实性就不那么有信心了。

到目前为止给出的所有示例都依赖于一个基本假设,即测试条件和环境随时间变化保持一致。如果我们想测量一个学生一学年的身高增加了多少,我们不会在秋天光着脚测量,然后在春天穿3英寸厚的厚底鞋测量。如果我们这样做了,我们就不能确信观察到的学生身高变化完全是由于身体发育。同样的原则也适用于衡量成就的增长。

在理解和解释学生MAP分数随着时间的推移异常大幅度的增长或下降时,这是一个特别重要的考虑因素。在很多情况下,当一个学生在两个测试项目之间的分数出现意外下降时,这种变化可以归因于其他因素。这个学生在考试上花的时间太少了吗?学生是积极参与的,还是他/她对项目的反应是随机的?MAP系统被设计为使测试持续时间为6分钟或更短的任何测试无效,但测试持续时间为10-15分钟也可能是可疑的。为了让学生在这段时间内完成45-50个项目的MAP测试,学生几乎肯定需要快速完成测试。这可能会导致更高的SEM和更低的RIT分数。

那么我们能做什么呢?

  • 如果可能的话,确保你的考试监考人记录了开始和结束时间。
  • 监考官应该在教室里四处走动,记录学生的进步情况。例如,如果一个学生在5分钟内完成了20道题,这个学生可能没有完全投入。记住,如果监考人员觉得学生没有专心,他们可以暂停或重新开始学生的考试。
  • 重新测试也是一个选择。如果一个学生的分数大幅下降(例如>10分RIT),特别是如果考试时间也大幅下降,可能需要重新考试。
  • 利用显示测试持续时间的NWEA报告。综合数据文件(CDF)显示所有MAP测试的测试持续时间。如果你看到考试时间少于15分钟,你应该怀疑学生是否全身心投入了。
  • 仔细安排您的MAP测试窗口。如果MAP测试太接近州测试,或者太接近寒假、春假或其他假期,学生的参与度可能会受到影响。
  • 注意承诺“在每个人都完成测试后,有娱乐或自由时间。”MAP是一项没有时间限制的测试,但如果学生们知道一旦他们做完就会有美食等着他们,他们可能会倾向于匆忙地通过它。
  • 保持测试季节的一致性。如果学生在一个赛季的考试后获得了一些特殊的庆祝奖励或活动,所有赛季都应适用相同的政策。
  • 请致电您的NWEA合作伙伴代表获取更多信息和建议。我们在此与您合作,尽我们所能使您的生活更轻松一些。帮助总是只需要一个电话或一封电子邮件。

电子书

建立数学自信

很多孩子害怕数学。你可以帮助他们爱上它。从我们的Teach。学习。成长。数学专家在我们最新的电子书中。

下载

博客

为决策者

在COVID-19期间,政策制定者可以做很多事情来支持学校。我们与专家Evan Stone和LaTanya Pattillo讨论了SY21-22年会的重点。

阅读文章

文章

阅读的基本知识

有效的识字教学必须依靠阅读科学和平衡识字的最佳实践。

了解更多

保持更新

注册我们的时事通讯,就可以获得最近的博客文章——以及更多内容——直接发送到你的收件箱。

帮我报名吧