文档介绍:测验的效度
11/10/2017
1
第一单元效度的概念
定义
效度(validity),在心理测验中是指所测量的与所要测量的心理特点之间吻合的程度。
心理测验的准确性
心理测验的有效性(龚耀先)
在编制或修订心理测验时,效度研究是必须的环节,效度资料是测验手册里必备的测量学指标。
在使用心理测验时,没有效度资料的测验也不能使用。
11/10/2017
2
测量的效度受随机误差和系统误差的影响
测验分数的总方差(SX2) =真实方差(ST2) +误差方差( SE2 )
真实方差(ST2)=有关的方差(SV2有效方差)+无关但稳定方差(SI2系统误差)
SX2 = SV2+ SI2+SE2
信度rxy2=有效方差SV2 /总方差SX2
11/10/2017
3
信度和效度的关系
信度和效度的差别在于所涉及的误差不同
信度考虑的是随机误差的影响
效度则还包括测验稳定的测量误差(系统误差)
信度是效度的必要条件而非充分条件
一个高效度的测验,其信度必然也高;
一个高信度的测验,其效度不一定高。
(可信的测验未必有效,而有效的测验必定可信。)
效度受信度的制约
效度与信度的关系式:rxy≤√rxx
rxy效度系数
rxx信度系数
11/10/2017
4
二、效度的性质
(一)效度具有相对性
评价测验效度时,必须考虑其目的与功能
(二)效度具有连续性
测验效度只是程度上的不同,而没有“全”或“无”的区别
评价一个测验,不应该说“有效”或“无效”,而应该用效度较高或较低来评价
测验有效性是针对测验结果而言
11/10/2017
5
第二单元效度评估的方法
一、内容效度(content–related validity)
(一)什么是内容效度
指测验条目对有关内容或行为取样的实用性。换句话说,所选用的条目是否能测到想要测量的行为。
1、对所测量的心理特征有明确的概念
2、测验题目应是所界定的内容范围的代表性取样
要求内容效度的测验,不一定要求测验为同质的。
测量单一心理特质的测验要求测验条目有高度的同质性
测量一组不同心理特质的成套量表,不要求各分测验之间具有同质性。
11/10/2017
6
(二)内容效度的评估方法
1、专家判断法
请有关专家对条目进行审定(逻辑效度)
审定步骤
①定义测验总体范围,描述相关知识与技能及所用材料的来源。
②编制双向细目表,确定各种内容所占比例,标出每个条目设计所测内容。(见表)
③制定一个相应的评定量表来评价效度,如测验包括的内容、技能、材料的重要程度、条目对内容的实用性等。请每位评定者对各方面进行评价,然后总合所有评定者的评价。
11/10/2017
7
高中化学标准测验双向细目表
识记
了解
应用
分析
综合
评估
合计
第一章
8
2
10
第二章
10
6
2
10
28
第三章
3
6
2
4
7
22
第四章
2
9
12
6
5
6
40
合计
5
25
28
14
22
6
100
11/10/2017
8
2、统计分析法
计算两个评分者之间一致性
克伦巴赫推荐的方法:先编出两个测验复本(取自同样内容范围),在同一组被试中实测,然后计算其相关。
再测法:学习前先测验一次,学习后在测试一次,计算两次相关。
3、经验推测法
通过实践来检验
如检验儿童发展量表的效度,观察不同年龄阶段儿童通过率是否随年龄的增长而增加。
11/10/2017
9
(三)内容效度的特性
1、不是普遍适用,根据具体情况分析;
2、有时间上的特定性,适合过去总体的代表性测验,未必符合现在的总体。
3、不同类型的测验对表面效度的要求是不同的
表面效度
是由外行对测验做表面上的检查,不反映测验实际测量的东西,只是指测验表面上看来好象是测量所要测的东西。
考虑题目与测量目的之间明显的、直接的关系。
编制测验,表面效度是一个必须考虑的特性。
需要被试者在测验中尽最大努力的测验要求较高的表面效度
需要被试这尽可能按自己实际情况回答的测验要求较低的表面效度
11/10/2017
10