文档介绍:pearson相关和spearman的区别
两个变量之间的皮尔逊积矩相关系数定义为这两个变量的协方差与二者标准差积的商,即
spearman 的区别" title="[转载]pearson相关和 spearman 的区别" height="58" width="316">上式定义了总体相关系数,一般用希腊字母ρ(rho)表示。若用样本计算的协方差和标准差代替总体的协方差和标准差,则为样本相关系数,一般用r表示:
spearman 的区别" title="[转载]pearson相关和 spearman 的区别" height="125" width="294">另外一个与上式等效的定义相关系数的公式是通过标准化以后变量均值的积定义的。假设样本可以记为spearman 的区别" title="[转载]pearson相关和 spearman 的区别" height="38" width="67">,则样本Pearson相关系数为
spearman 的区别" title="[转载]pearson相关和 spearman 的区别" height="100" width="316">其中spearman 的区别" title="[转载]pearson相关和 spearman 的区别" height="73" width="157">别为标准化变量,样本均值和样本标准差。
1总体的Pearson相关系数是通过原点矩来定义的,所以二元概率分布的总体协方差以及变量边缘总体反差必须是有意义且是非零的。一些概率分布例如柯西(Cauchy)分布的反差就是无意义的,因此在X或Y服从这种分布时,是没有意义的。对于二元正态分布的,Pearson相关系数可以精确地