文档介绍:第 27 卷心理学探新么刃7 年
总第 1以期巧 Y C H O 任犯IC A L E X PI刀R A 竹O N 第 4 期
Ras h 客观等距测量在 PI SA 中国试测研究中的实践
王蕾
(教育部考试中心评价处,北京 1〕洲死鸿
摘要:RaSC h 浏量是当前心理浏量中具有客观等距童尺的浏童,克服了传统经典浏童的浏脸
依赖和样本依赖的局限。以学生能力国际评价PISA 中国试浏研究为例,说明利SA 扣何应用凡印h
测量达到跨越国家和地区教育成效比较的浏量目的。客观等距量尺研究对改进和完善我国心理
浏量与教育评价具有重要参考价值。
关键词:曰SA ;教育评价;凡既h模型;客观浏量;等距量尺
中图分类号: 文献标识码:A 文章编号:1(X) 3一51 84 恤兀斤)以一以义刃一仍
心理测量,如认知、人格、态度、兴趣等的测1。全一受试者的测验原始分98 是班级第一名,乙受试者的
直苦于无法达到物理测量般的客观和等距。乔治· 测验原始分% 是班级第二名,丙受试者测验原始分
拉什(G阳飞触 h:1叨1一1950)创始的触h模型〔,, 叭是班级第三名。表面上 98 、% 、男虽然有着 98 一
成功的克服了这一困境。越来越多的学者认识到% 二% 一94 的关系,但本质上,很难说甲乙两生之
RaSC h 测量是可以使得心理测量达到客观等距的方间学业程度差异,恰等于乙丙两生的差异,只能说
法。在世界上具有较大影响的大规模国际教育评价 98 > % > 94 的顺序关系是成立的。因此原始分只
项目PISA(肠91翻nl l犯for lntemation al stud ent As se ss- 有顺序意义,无法精确描述其间的差距。在问卷调
二nt ),其阅读、数学和科学认知测验以及通过学生查里,常会要求受试者按李克特量尺来做答。以五
问卷和学校问卷收集的社会、文化、经济和教育因素点李克特量尺为例:“对于部分高校实行5% 名额的
的指标,就是通过凡耽h 测量进行题目的建构、参数自主招生,您的意见是 1完全同意、2 比较同意、3
校准和相关分析。PISA 如同用尺子量学生身高一一般、4 比较不同意、5 完全不同意”。研究者常分别
样,用R力鱿h 模型建构校准的,涵盖完整难易度的题以1,2,3,4,5代表这五点。这五点只能算是顺序量
目测量不同层次学生多维度能力发展水平、学习动尺,因为没有证据显示 1到2 的差距等于2 到3 的
机和态度等,进而进行国家间与地区间横向和跨年差距。将这些题目的得分加总后的总分也只是顺序
度纵向比较。这是国内普遍使用的依据经典测量理量尺。
论建立的测评工具根本无法实现的。客观等距量尺等距量尺不仅有顺序意义,还有差距的意义。
研究对改进和完善我国心理测量与教育评价具有重例如摄氏25 度和26 度之间的差距,等于26 度和27
要参考价值。度之间的差距。简而言之,1 度的差距在任何度数
1 心理测且中顺序t 尺当成等距t 尺的错用上都有相等的距离,因此称为等距量尺。
著名心理学家史蒂文斯( ens )1946 年提 2 凡即h 客观等距测t 的分析程序
出了名义量尺、顺序量尺、等距量尺、比率量