1 / 23
文档名称:

SAS系统和数据分析Spearman等级相关分析.doc

格式:doc   大小:934KB   页数:23页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

SAS系统和数据分析Spearman等级相关分析.doc

上传人:miao19720107 2018/1/22 文件大小:934 KB

下载得到文件列表

SAS系统和数据分析Spearman等级相关分析.doc

文档介绍

文档介绍:Spearman等级相关分析
秩相关的Spearman等级相关分析
前面介绍了使用非参数方法比较总体的位置或刻度参数,我们同样也可以用非参数方法比较两总体之间的相关问题。秩相关(rank correlation)又称等级相关,它是一种分析和等级间是否相关的方法。适用于某些不能准确地测量指标值而只能以严重程度、名次先后、反应大小等定出的等级资料,也适用于某些不呈正态分布或难于判断分布的资料。
设和分别为和各自在变量X和变量Y中的秩,如果变量X与变量Y之间存在着正相关,那么X与Y应当是同时增加或减少,这种现象当然会反映在(,)相应的秩(,)上。反之,若(,)具有同步性,那么(,)的变化也具有同步性。因此:
()
具有较小的数值。如果变量X与变量Y之间存在着负相关,那么X与Y中一个增加时,另一个在减小,具有较大的数值。既然由(,)构成的样本相关系数反映了X与Y之间相关与否的信息,那么在参数相关系数的公式中以和分别代替和,不是同样地反映了这种信息吗?基于这种想法,Charles Spearman秩相关系数应运而生:
()
与形式上完全一致,但在中的秩,不管X与Y取值如何,总是只取1到之间的数值,因此它不涉及X与Y总体其他的内在性质,例如,秩相关不需要总体具有有限两阶矩的要求。由于:
因此,公式()可以化简为:
()
显然在=时,秩相关系数达到最大值+1。又因为:
而在每对+=时达到最小值,最小值求法为:
所以,最小的为:
最大的为:
故秩相关系数的最小值为1-2=-1。
在原假设和不相关的情况为真时,即秩相关系数为0时,的期望值为0,样本的方差为
()
自由度为且分布关于零点对称。当10时,的样本分布可以标准化为近似的t分布:
()
。为了调查这个问题,公司的副总裁仔细地查看和评价了公司10个职工的初始面试摘要、学科成绩、推荐信等材料,最后副总裁根据他们成功的潜能给出了单独的等级评分。二年后获得了实际的销售记录,得到了第二份等级评分,。统计问题为是否职工的销售潜能与开始二年的实际销售成绩一致。
职工的销售潜能与销售成绩的秩相关分析
职工编号
潜能等级
销售成绩
成绩等级
1
2
400
1
1
1
2
4
360
3
1
1
3
7
300
5
2
4
4
1
295
6
-5
25
5
6
280
7
-1
1
6
3
350
4
-1
1
7
10
200
10
0
0
8
9
260
8
1
1
9
8
220
9
-1
1
10
5
385
2
3
9
44
,最后计算结果为
表明潜能与成绩之间是较强的正相关,高的潜能趋向于好的成绩。秩相关系数原假设为0的t检验统计量为:
查表自由度为8,t==。,,>,因此,拒绝秩相关系数为0的原假设,接受潜能与成绩之间存在秩相关。
Corr相关过程
Corr相关过程用于计算变量之间的相关系数,包括Pearson(皮尔逊)的乘积矩相关和加权乘积矩相关。还能产生三个非参数的关联测量:Spearman的秩相关,Kendall的tau-b和Hoeffding的相关性度量D。该过程也可以计算偏相关等一些单变量的描述性统计量。
Corr过程说明
proc corr过程一般由下列语句控制:
proc corr data=数据集<选项>;
var 变量列表;
with 变量列表;
partial 变量列表;
weight 变量;
freq 变量;
By 变量列表;
run ;
proc corr语句调用corr过程,且是唯一必需的语句。如果只使用proc corr这一条语句,过程计算输入数据集中所有数值变量之间的相关系数。其余语句是供选择的。
proc corr语句的选项
outp=数据集名——产生含有Pearson相关系数的一个新数据集。
outs=数据集名——产生含有Spearman等级相关系数的一个新数据集。
outk=数据集名——产生含有Kendallτb相关系数的一个新数据集。
outh=数据集名——产生含有Hoeffding D统计量的一个新数据集。
pearson——要求计算通常的pearson乘积矩相关系数,是缺省值。
hoeffding——要求计算并输出H