文档介绍：第 26 卷心理学探新 2006 年
总第 99 期 P SY C H O L O G IC A E X P L O R A T IO N 第 3 期
资格认证测验的信度估计及其特征分析
赵世明
(中国浦东干部学院领导研究院,上海 20120 4)
摘要:资格认证All验属于典型的标准参照浏验,在国内已得到普遮应用,但在报告心理测童
学指标时很少提到标准参照模式的信度估计指标。该文归纳了标准参照浏验信度估计的指标体
系,分析讨论了适用于资格认证测验的信度佑计及其与测验长度、分界标准分布、样本同质性的关
系与特征。
关键词:标准参照浏验;资格认证浏验;信度估计;概化理论
中图分类号: 文献标识码:A 文章编号:: 1003 一5184(2006)03 0084 一04
在标准参照测验的研究文献中,信度估计是研法编制的平行测验复本,属于同一测量目标下“题目
究最为深人和广泛的课题之一。以资格认证测验为集合”的同质样本,这些题目样本或测验复本的测量
代表的标准参照测验在均分数、方差、难度及题目间相关(同质性)
报告心理测量学指标时很少提到标准参照模式的信均是相同的,这类复本称为“经典的平行测验复本”;
度估计,多数以相关法报告内部一致性信度或分半以随机方式编制的测验复本并不要求各题目样本或
信度,在美国八十年代初期也是这种状况川。资格测验复本同质,复本之间允许有不同的均数与方差,
认证测验属于典型的标准参照测验,由于被试变异这种假设相对较弱一些,题目样本是从“所有可能的
的减小,以常模参照模式估计信度指标时容易低估, 题目领域”中以随机或分层随机方式抽取的,此类复
相关法不再适用。因此在探讨各类信度指标的适用本称为“随机的平行测验复本”。在估计信度时,如
性基础上,应尽早将标准参照模式的信度估计指标果只考虑被试差异带来的组内效应及被试与题目的
体系引人各类资格认证测验或能力水平测验。交互作用,即利用经典复本的信度估计方法;在此基
1 标准参照测验信度估计的指标体系础上,如果还考虑题目差异带来的组间效应(实际上
H ambleton等人(1978)归纳了标准参照测验的属于一种随机误差),就要利用随机复本的信度估计
三类信度估计指标:基于分类一致性信度、测验分数方法。
信度和领域分数估计值信度[[ 2l。在一般意义的信度可以利用概化理论中题目x 被试设计的“D 研
概念中,人们习惯将后两者信度估计指标看作是标究”。将题目视为“面”,形成一个单面交叉设计;
准参照测验的信度。研究主要讨论这两类标准参照测验看作是随机平行复本。利用代表领域分数变异
测验的信度估计。在此领域中,测验信度估计主要与观测分数变异之比的“依存性指数(Indeode-
是由来自被试、题目、测量误差的方差分量之间的关 pendability)”估计标准参照测验的分数信度,其大小
系所决定。方差分析是信度估计的基础。实际上, 反映估计被试领域分数的可靠性。在概化理论中的
标准参照模式的信度估计更能体现信度概念的基本 D 研究中,复本是依照随机原则编制的。也就是说,
假设:由分数变异之间的关系界定测验分数的可靠编制复本并不要求按照严格的平行原则,从总体中
性。借助方差