衡量学生成长:什么是量表,稳定性意味着什么?

衡量学生成长|什么是量表,稳定性意味着什么?衡量学生的成长是教育工作者角色的一个关键部分,为了准确衡量学生的成长,测量量表随着时间的推移的稳定性是必要的。那么什么是量表,稳定性又意味着什么呢?

规模是令英语学习者困惑的单词之一,因为它有各种各样且不相关的含义,从某些动物身上的遮盖物,到导致失明的原因,再到有等级的仪器。当我们谈论教育测量中的量表时,我们谈论的是类似于后一种定义的东西:一个表示学生在某一领域能力程度的结构,比如数学推理。我们把这种能力称为潜在特质,因为我们不能直接看到一个学生的数学推理能力,就像我们可以看到一个学生的数学推理能力一样头发的颜色或者她穿的鞋子。尽管我们无法与它进行物理互动,但我们知道数学推理是真实存在的。它类似于一种心理状态,如幸福——它存在于一个人的内在。量化,或测量,潜在的特征是一个微妙的努力,我们带来了统计建模的力量。

要衡量一个潜在的特征,我们必须先引出它。我们通过使用测试项目、表现任务和写作样本等工具来引出潜在特征的证据。证据是特质本身的代理或代表。我们通过身体语言、笑声或微笑等特定指标来推断一个人是否快乐。同样地,我们推断一个潜在特征的程度,例如通过我们从引出该特征中得到的证据来进行数学推理。

并非所有的教育测量量表都是天生稳定的。许多天平可以,而且确实会随着时间漂移……”

一旦我们得到了某种潜在特质的证据,我们就会用量表来衡量这些证据。所使用的刻度衡量学术进步®(MAP®)K-12的评估是一个相等的间隔测量称为罗切斯特理工学院的航拍规模.等距刻度提供了关于顺序的特定类型的信息,即刻度上的点之间有相同的距离,或相同数量的潜在质量。等距刻度的另一个例子是温度计。等距量表的价值在于其一致性和客观性;这些品质有助于使天平长期稳定。

规模稳定意味着量表保持其测量特征,允许比较学生组、增长估计和纵向研究之间的评估分数。例如,1975年的RIT得分为215,相当于1995年的RIT得分为215。保持这种刻度的稳定性——使我们的刻度年复一年地以完全相同的方式保持其测量属性——是我们在NWEA所做的关键部分。

并非所有的教育测量量表都是天生稳定的。许多尺度会随着时间的推移而漂移,这意味着被测量的潜在数量会发生变化。随着时间的推移,项目校准会变得更困难或更容易。这对于衡量增长或进行任何纵向比较来说都是灾难性的。随着时间的推移,体重秤可能会发生变化,原因有很多:

  • 课程变化(包括教学方法)
  • 标准的变化或内容领域的价值
  • 测试人群随时间的变化
  • 测试或评估的利害关系、社会背景或与之相关的意义和后果的变化
  • 评估的预期目的有所改变

面对这些变化,保护我们的量表的完整性使我们(NWEA)能够随着时间的推移保持显著的稳定性。这种稳定性使我们对根据MAP评估收集的数据做出的教育决策有信心。我们意识到保持比例尺稳定性的重要性,因此我们将监测比例尺漂移作为优先事项。该量表将所有项目与学生的分数联系起来。我们确保我们的数据是衡量成长的黄金标准,因为我们知道每个学生都能成长。准确地报道这一增长对全国和世界各地学生的生活产生了影响。

电子书

建立数学自信

很多孩子害怕数学。你可以帮助他们爱上它。从我们的Teach获得建议。学习。成长。我们最新的电子书中的数学专家。

下载

博客

为决策者

在COVID-19期间,政策制定者可以做很多事情来支持学校。我们与专家Evan Stone和LaTanya Pattillo讨论了在SY21-22期间应该关注什么。

阅读文章

文章

阅读的基本知识

有效的识字教学必须依赖于阅读科学和平衡识字的最佳实践。

了解更多

保持更新

注册我们的通讯,并获得最近的博客文章- - - - - - - - - - - - - -直接发送到您的收件箱。

帮我报名吧