文档介绍:基于秩次的非参数检验
1. 问题的提出
前面学习了连续型资料两组样本均数差异的假设检验方法:
小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。
如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?
需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念
前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。这类检验方法称参数检验(parametric test)。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。(distribution-free test)
非参数检验的优点:
,适用范围广。
。
。
缺点:
如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。
基于秩次非参数检验(秩和检验)的基本思想
, , , ,
显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。但如果将变量作转换,变成秩变量Y=1,2,3, 4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。
配对样本的符号秩检验(Wilcoxon signed rank test)
为研究出生先后的孪生兄弟间智力是否存在差异,。
12对孪生兄弟测试结果
对子号
兄的得分
弟的得分
得分差
秩次
对子号
兄的得分
弟的得分
得分差
秩次
1
86
88
2
3
7
77
65
-12
-10
2
71
77
6
7
8
91
90
-1
-
3
77
76
-1
-
9
70
65
-5
-
4
68
64
-4
-4
10
71
80
9
9
5
91
96
5
11
88
81
-7
-8
6
72
72
0
-
12
87
72
-15
-11
T+=,T-=
符号秩检验的分布理论:假定有4个差值,如果H0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。4个差值每种组合发生的可能性就是:
。所有可能的秩和情况和T*。
n=4时所有可能秩和情况和T*的分布
正差数
的秩次
负差值
的秩次
正秩和
T+
负秩和
T-
检验统计量T*
概率
P
1,2,3,4
--
10
0
0
2,3,4
1
9
1
1
1,3,4
2
8
2
2
1,2,4
3
7
3
3
3,4
1,2
7
3
3
1,2,3
4
6
4
4
2,4
1,3
6
4
4
1,4
2,3
5
5
5
2,3
1,4
5
5
5
1,3
2,4
4
6
4
4
1,2,3
4
6
4
1,2
3,4
3
7
3
3
1,2,4
3
7
3
2
1,3,4
2
8
2
1
2,3,4
1
9
1
-
1,2,3,4
0
10
0
如果零假设成立,观察的结果应该服从这分布,即出现极端的可能性很小。如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假设。
表 Wilcoxon 符号秩检验的判断原则
双侧检验
单侧检验(1)
单侧检验(2)
检验假设
H0:Md(d)=0
H0:Md(d)=0
H0:Md(d)=0
H1:Md(d)≠0
H1:Md(d)>0
H1:Md(d)<0
统计决策:
小样本查表法
若T*≤Ta/2(n),
则拒绝H0
若T-≤Ta(n),
则拒绝H0
若T+≤Ta(n),
则拒绝H0
大样本