文档介绍:第卷心理学探新年
BB B%%B
总第期第期
&B ;EFGHC<:1HIH3F"JK!HGH=J B
中国少数民族考生与外国考生成绩
!"#
的公平性分析
任杰谢小庆
(北京语言文化大学汉语水平考试中心,北京)
$%%%&’
摘要:该研究利用项目功能差异( ,简称)理论,对考生
()**+,+-.)/01.+234-5.)6-)-7 (13 !"#
中不同两个群体———外国人和中国国内的少数民族,进行题目的反应分析。考查的题目是
!"#
否存在不利于某一群体。具体做法:采用和方法检测,利用标准化的离散分析
8! "19:;": (13
方法和的项目束分析法鉴别的真伪,并寻找造成的原因。由数据分析的结果
"19:;": (13 (13
可知, (初、中等) 卷对于外国考生和中国国内的少数民族考生存在一些有的题目。
!"# < (13
关键词:项目功能差异( );汉语水平考试( ); 方法; 方法;标准化的离散
(13 !"# 8! "19:;":
分析方法
中图分类号: 文献标识码: 文章编号: ( )
=>%?%@$ < $%%’A@$&>B%%B%BA%%@$A%@
引言
$
项目功能差异( ,简称)指的是某项目(题目)在不同群体
()**+,+-.)/01.+234-5.)6-)-7 (13
间表现出与测验目的无关的功能性差异。例如,某一含有足球知识的数学题,对于具有相同数
学能力的两组被试,由于足球知识水平不同,而影响他们对题目的正确反应。如果出题者只是
想测试考生的数学能力,那么,该题目对于足球知识很少的考生,就是不公平的。我们说该题
目存在项目功能差异,即有。
(13
检测题目是否存在项目功能差异,关键在于如何判定两组被试是否具有相同的能力,即确
定匹配变量。理想的匹配变量应该是对测验希望测试的能力的一种有效、可信和无偏的测量,
这种测量显然是不可能的。对于大部分分析而言,适宜的匹配量是测验总分(包括测验
(13
的部分或全部题目),即当两组被试的测验总分相同时,我们就说他们具有相同的能力。两组
被试分别称为参照组( )和目标组( ),目标组通常是可能被不公平对
C+*+,+-5+7,64D 365/07,64D
待的群体,参照组通常是用做比较的对象。
汉语水平考试( )是测试母语非汉语者的汉语水平而设立的一种国家级标准化考试。
!"#
考生对象是外国人、华侨和中国国内的少数民族。外国人和中国国内的少数民族(以下简称少
数民族)学习和使用汉语的环境不同,这是否影响他们对题目的反应?少数民族对汉文
!"#
化的了解和认同度要大于外国人,因此我们决定将少数民族作为参照组,考查题目中是
!"#
否存在不万方数据利于外国人的。(初、中等)试卷是由听力、语法、阅读和综合四个分测验组成的,
!"#
心理学探新年
9! !**!
因此在本研究中我们将分测验总分作为匹配变量。
研究材料
!
(初、中等)某试卷(以下简称卷),数据是年参加该试卷考试的外国人(
"#$ % &’’’()&)
人)和年新疆少数民族考生( 人) 道题目的成绩。
!*** &*+,* &