二、教育测量学基本理论与方法的评析
下面对20世纪主要的教育测量理论:经典测量理论与题目反应理论作出比较与评析。
(一)经典测量理论的优点与不足
经典测量理论经过几十年的发展,形成了以真分数理论作为其理论基础,并具有完善、可操作的对题目和测验进行统计分析的方法。
经典测量理论的优点在于:(1)以弱假设作为理论基础。 这些弱假设条件容易被绝大多数测验数据资料所满足。所以,从实用的意义上说,其应用具有广泛性。(2)具有明了简单的统计分析方法, 且这些统计分析方法都有数学上的实际意义,易于掌握和理解。(3 )我国教育测量工作者对经典测量理论及方法有深刻的认识,其应用具有基础性。
其不足之处有:(1 )经典测量理论的方法所求得的题目参数(如题目难度、题目区分度)会受到不同考生样本组能力水平的影响。所以,选取的考生样本不同,就有可能得出不同的题目难度和题目区分度,故在考生样本选取方面要做到非常精确有一定的困难。(2 )在经典测量理论的条件下,题目参数与考生得分量是在不同的基础上分别求得的,所以无法建立考生得分与测验题目参数之间的函数关系,即考生能力的估计会由于测验的改变而改变。(3 )经典测量理论中有两个重要的假设条件,即严格的平行测验和测验误差与真分数相关为零,这在实际操作中是难以做到的。
(二)经典测量理论的质量评估
测量工具决定着测量结果的准确性。所以,良好的测验也决定着测量结果的准确度,评价一份测验的优良性,主要有以下内容。
1.效度。它是指测验是否测出了所要测的东西。效度分为:(1 )内容效度,即测验的题目与内容是否与教学内容与目的相适应。(2 )构想效度,即测验的分数是否达到了某一预想的特质。(3 )效标关联效度,用测验所得分数与标准测验所得的分数的相关来制定这次测验的效度,称之为效标关联效度,而标准测验则被称之为“效标”,在此起到预测作用。
2.信度。信度是反映测量的一致性程度的指标。计算信度的方法主要有:(1)再测信度,即对同一被试总体进行重复测量而得到的两组数据,以相关系数的大小表示一致性程度,相关系数高,则说明信度高。(2)复本信度,即建立两个在内容、质量各方面都相等的测验,并对实施后的两个测验分数求相关。(3)分半信度, 把一个测验分为质量相等的两部分,求这两部分所得的分数的相关。要提高信度,可以加长测验。但信度是效度的必要条件,而不是充分条件,即信度低,效度不可能高,但信度高,效度不一定高。