1 / 6
文档名称:

Pearson相关系数和Spearman秩相关系数介绍.docx

格式:docx   大小:272KB   页数:6页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Pearson相关系数和Spearman秩相关系数介绍.docx

上传人:sssmppp 2019/6/27 文件大小:272 KB

下载得到文件列表

Pearson相关系数和Spearman秩相关系数介绍.docx

文档介绍

文档介绍:皮尔逊积矩相关系数(Pearsonproduct-momentcorrelationcoefficient)1定义在统计学中,皮尔逊积矩相关系数(Pearsonproduct-momentcorrelationcoefficient),,通常用「或是p表示,是用来度量两个变量X和Y之间的相互关系(线性相关)的,取值范围在卜1,+1]之间。皮尔逊积矩相关系数在学术研究中被广泛应用来度量两个变量线性相关性的强弱,它是由KarlPearson在19世纪80年代从FrancisGalton介绍的想法基础发展起来的,但是发展后原想法相似但略有不同的,这种相关系数常被称为“Pearson的r”。两个变量之间的皮尔逊积矩相关系数定义为这两个变量的协方差与二者标准差积的商,即亠_cov(x,r)_e(x-|ix)(y-nr)Pxy一 一上式定义了总体相关系数,一般用希腊字母p(rho)表示。若用样本计算的协方差和标准差代替总体的协方差和标准差,则为样本相关系数,一般用「表示:£(X厂片)(£-Y)另外一个与上式等效的定义相关系数的公式是通过标准化以后变量均值的积定义的。假设样本可以记为,则样本Pearson相关系数为其中■兰,乂和心分别为标准化变量,样本均值和样本标准差。Sx2皮尔逊积矩相关系数的数学特性不论是样本的还是总体的Pearson相关系数绝对值均小于等于b相关系数等于1或J时,所冇数据的点都精确地落在一条直线上(为样本相关系数的情况),或是两变量的分布完全由一条直线支撑(为总体相关系数的情况)。Pearson相关系数具有对称性,即:corrcorr(X,Y)=corr(K,X)0Pearson相关系数的一个关键的特性就是它并不随着变量的位置或是大小的变化而变化。也就是说,我们可以把X变为a+bX,把Y变为c+dY,其中a,b,c和d都是常数,而并不会改变相互之间的相关系数(这点对总体和样本Pearson相关系数都成立)。Pearson相关系数可以用原点矩的形式表示。因为皿=E(X),覺=[E(X)-X]2=E(X2)-E2(X),对于Y也有相似的表达式。又E[(X-E(X))E(Y-E(Y))]=E(XY)-E(X)E(Y)于是式(1)可写为E(XY)-E(X)E(y)JeXi-eZJeVS上述形式对于样本的Pearson相关系数同样是可用的,冇r=〃罗= 孙工兀莎一工兀工x 仃一(H・一6工£-(工吃并-(工yj上式提供了一个非常简单的计算样本相关系数的算法,但是有时受数据的影响,可上式可能存在数值上的不稳定性。相关系数取值范围为卜1,1]。取1时表示变量X和Y之间具有线性变化的关系,即Y随着X的增加而增加,而且所有的点都落在一条直线上。取时则是所有点落在一条直线上,但是变量Y随着X的增加而减小。相关系数值为0是表示变量之间没有线性相关关系。更一般地,应该注意到,只要x,和匕落在各自均值的同一侧,那么(x(-x)(^-r)就是大于o的。也就是说,只要X,和Z同时趋近于大于或是同时趋近于小于他们各自的均值,那么它们的相关系数为正。反之,当二者区于在相反的一边时,二者相关系数为负。--(x,y)点即相应的X、y的相关系数。可以看出,相关反映线性关系分散程度和方向(第一行),但是不能反映线性关系时的斜率(