【一参数逻辑斯蒂模型对推理测验分数资料的拟合性研究】魏彬.pdf

目 摘要 第一部分:在我国的心理与教育测量中使用新的测量理论(巡目反应理论)的必要性和司行性 一、经典测量理论的缺陷 二、超目反应理论 三、一参数逻辑斯帝模型 四、我们的选择 第二部分:对本项研究的几点说明 一、问趟的提出 二、基本设想 三、有关的类学间题 1、参效的估计 2、模型与分数资料的拟合性 四、推理测验 第三部分买测方法 第四部分:结果与分析 一、模型与总的分数矩阵的拟合性 二、区分度的影啊 三、对指示语的分析 四、混合熄目与单一题目的比较 五、参数估计的不变性 六、两种方法的比较 七、对实验结呆的补充说明
摘要 本文从测验程论的发展和我国的实际情况出发,论证了在我国 的教育和心理验中使用题目反应模型的必要性和可行性,特别指出 一参没逻辑斯带模型在大规模测验中的优越性,由此提出了此模型 对实得分数资料的拟合性,研究中使用了推理测验题目(瑞文推理 矩阵题目和词语类推题目),分数资科来自初二和高一的学生,比 较了给指示语“答错付扣一分”和不给此指示语的被试的分数 资料,经过和不经过区分度(Q3一10的点二列相关)选 择的题目的分数资料,混合题目和单一题目的分数资料之间在 拟合性上的差别,考察了参数估计的不变性,比较了UCON(非条 件极大似然估计)和PROX(UCON的近似)所得的结
便无法比较两次得分高就低,除非利用另一个蒸准测验将这两 个测验进行平衡,确定了它们的相对特征后才能进行比较,所以在 经典理论中,题目难皮与受测者的能力水平混在一起,各自只有其 相对意义.题目的区分度也是如此,它与样本的同质性呈负相关,所以区 分指数只对那些与进行题目分析所用的样本具有相近的分布的样本 才有意义。测验的信度也具有同样的问题,并且由于概念上存在着 难以解容的问题,有人反对再在这方面作文章(有关综述见工uims一 den.J;Weiss,D,J. 