【一参数逻辑斯蒂模型对推理测验分数资料的拟合性研究】魏彬.pdf

目摘要第一部分:在我国的心理与教育测量中使用新的测量理论(巡目反应理论)的必要性和司行性一、经典测量理论的缺陷二、超目反应理论三、一参数逻辑斯帝模型四、我们的选择第二部分:对本项研究的几点说明一、问趟的提出二、基本设想三、有关的类学间题 1、参效的估计 2、模型与分数资料的拟合性四、推理测验第三部分买测方法第四部分:结果与分析一、模型与总的分数矩阵的拟合性二、区分度的影啊三、对指示语的分析四、混合熄目与单一题目的比较五、参数估计的不变性六、两种方法的比较七、对实验结呆的补充说明

摘要本文从测验程论的发展和我国的实际情况出发,论证了在我国的教育和心理验中使用题目反应模型的必要性和可行性,特别指出一参没逻辑斯带模型在大规模测验中的优越性,由此提出了此模型对实得分数资料的拟合性,研究中使用了推理测验题目(瑞文推理矩阵题目和词语类推题目),分数资科来自初二和高一的学生,比较了给指示语“答错付扣一分”和不给此指示语的被试的分数资料,经过和不经过区分度(Q3一10的点二列相关)选择的题目的分数资料,混合题目和单一题目的分数资料之间在拟合性上的差别,考察了参数估计的不变性,比较了UCON(非条件极大似然估计)和PROX(UCON的近似)所得的结

便无法比较两次得分高就低,除非利用另一个蒸准测验将这两个测验进行平衡,确定了它们的相对特征后才能进行比较,所以在经典理论中,题目难皮与受测者的能力水平混在一起,各自只有其相对意义.题目的区分度也是如此,它与样本的同质性呈负相关,所以区分指数只对那些与进行题目分析所用的样本具有相近的分布的样本才有意义。测验的信度也具有同样的问题,并且由于概念上存在着难以解容的问题,有人反对再在这方面作文章(有关综述见工uims一 den.J;Weiss,D,J.