文档介绍:第 23 卷心理学探新 2004 年
总第 91 期 PSY C H O LO G IC A E X PLO R A T IO N 第 3 期
Likert量表分析中不同 IRT 模型的有效性
郭庆科‘,周晶2
(,沈阳 116029;,莱芜 271100)
摘要:5 级 Likert 童表可直接分析,也可以转化为3 级评分,或转化为2 级评分,前二者可以采
用等级IRT 模型,后者可以采用2 级IRT 模型。研究表明2 级IRT 模型中的2 参数模型是最适合的
模型。多级评分模型与数据拟合也很好,而且等级越多测童精度越大。
关健词:Like-1 表项目反应理论两级评分模型多级评分模型
中圈分类号: 文献识别码:A 文童编号:1003 一5184(2004)03 一0067 一04
1 研究目的的是从模型与数据的拟合,模型提供的信息量等方
项目反应理论(IRT)代表了当今心理测验理论面比较不同模型的有效性。
的发展趋势,IRT 在测验编制和质量分析中具备经 2 研究方法
典测验理论(CTT)不可比拟的优点。目前 IRT 已经 2 .1 测量工具
被成功地应用到认知测验、人格测验、行为评定等几本研究的测量工具为北京师范大学心理测量研
乎所有测验研究领域,传统测量领域的所有问题究所郭庆科和孟庆茂主持编制的9 因素情感能力量
IRT 几乎都能解决[’]。经过十多年的发展,IRT 研究表(详见下文)。研究表明该量表有较好的信度和效
在我国已经取得了重大进展,但研究还主要集中在度,因此本研究的结论能推广到其他同类测验。
认知测验领域,而且主要涉及了两级评分的 IR'I,模 2 .2 被试
型。自陈量表式的人格测量在我国应用非常广泛, 山东师范大学2000,2001级大学生308 人,其中
Liken 量表则是自陈量表的主要形式之一,因此将理科 157 人,文科 151人,男女比为 143:165,泰安学
IRT 应用于这一研究领域有重要的现实意义。本研院2001,2002 级大学生 309 人,其中文科 155 人,理
究拟以情感能力量表量表(petence 科 154人,男女比为 168:141;莱芜市第三中学高一、
ScaleECT)为例,探讨 Liken 量表式测题分析中不同高二学生258 人,男女比为 128:130,泰安市第十四
IRT 模型的有效性。中学高一、高二学生306人,男女比为155:151,
E CT 各项目均采用 5 点 Liken 量表式测题(共 3 结果
1,2,3,4,5 五个等级),因此应采用 IRT 中的等级反 两级评分模型与数据的拟合性比较
应模型(GradeResponsModelGRM )(2],用MULTI- 两级评分资料分析时可采用 IPLM ,2PLM 或
LOG 软件进行参数估计[[ 3]。由于被试可能存在趋中 M R .(指 1,2 和 3 参数 Logistic 模型)。Zickar &
化和极端化反应倾向,选择第 1,2 个等级和第 4,5 Dmsgow 认为用两参数2PLM 模型分析人格测验非
个等级的人可能并不存在差