1 / 5
文档名称:

pearson相关系数和spearman秩相关系数介绍.doc

格式:doc   大小:258KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

pearson相关系数和spearman秩相关系数介绍.doc

上传人:liwenfei1314 2018/6/6 文件大小:258 KB

下载得到文件列表

pearson相关系数和spearman秩相关系数介绍.doc

文档介绍

文档介绍:R皮尔逊积矩相关系数(Pearson product-moment correlation coefficient)
1 定义
在统计学中,皮尔逊积矩相关系数(Pearson product-moment correlation coefficient),,通常用r或是ρ表示,是用来度量两个变量X和Y之间的相互关系(线性相关)的,取值范围在[-1,+1]之间。皮尔逊积矩相关系数在学术研究中被广泛应用来度量两个变量线性相关性的强弱,它是由Karl Pearson在19世纪80年代从Francis Galton介绍的想法基础发展起来的,但是发展后原想法相似但略有不同的,这种相关系数常被称为“Pearson的r”。
两个变量之间的皮尔逊积矩相关系数定义为这两个变量的协方差与二者标准差积的商,即
上式定义了总体相关系数,一般用希腊字母ρ(rho)表示。若用样本计算的协方差和标准差代替总体的协方差和标准差,则为样本相关系数,一般用r表示:
另外一个与上式等效的定义相关系数的公式是通过标准化以后变量均值的积定义的。假设样本可以记为,则样本Pearson相关系数为
其中,和分别为标准化变量,样本均值和样本标准差。
相关系数r定义与说明
相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。
相关系数又称皮(尔生)氏积矩相关系数,说明两个现象之间相关关系密切程度的统计分析指标。
相关系数用希腊字母γ表示,γ值的范围在-1和+1之间。
γ>0为正相关,γ<0为负相关。γ=0表示不相关;
γ的绝对值越大,相关程度越高。
两个现象之间的相关程度,一般划分为四级:
如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。通常|r|,认为两个变量有很强的线性相关性。
2 皮尔逊积矩相关系数的数学特性
不论是样本的还是总体的Pearson相关系数绝对值均小于等于1,相关系数等于1或-1时,所有数据的点都精确地落在一条直线上(为样本相关系数的情况),或是两变量的分布完全由一条直线支撑(为总体相关系数的情况)。Pearson相关系数具有对称性,即:corr。
Pearson相关系数的一个关键的特性就是它并不随着变量的位置或是大小的变化而变化。也就是说,我们可以把X变为a+bX,把Y变为c+dY,其中a,b,c和d都是常数,而并不会改变相互之间的相关系数(这点对总体和样本Pearson相关系数都成立)。
Pearson相关系数可以用原点矩的形式表示。因为
,,
对于Y也有相似的表达式。又
于是式(1)可写为
上述形式对于样本的Pearson相关系数同样是可用的,有
上式提供了一个非常简单的计算样本相关系数的算法,但是有时受数据的影响,可上式可能存在数值上的不稳定性。
相关系数取值范围为[