文档介绍:Pearson,Spearman和Kendall三种相关解析方法的异同
Pearson(皮尔逊):
线性相关性(linearcorrelation):又简称简单相关(simplecorrelation),用来胸襟拥有线性Pearson,Spearman和Kendall三种相关解析方法的异同
Pearson(皮尔逊):
线性相关性(linearcorrelation):又简称简单相关(simplecorrelation),用来胸襟拥有线性关系的两个变量之间,相关关系的亲密程度及其相关方向,适用于双变量正态散布资料。线性相关系数,又称为简单相关系数,Pearson(皮尔逊)相关系数或相关系数。有时也称为积差相关系数(coefficient
ofproduct-momentcorrelation)。
适用条件:
样本容量大于等于30,这样才能保证计算的数据拥有代表性,计算出的积差相关系数可以有效说明两个变量的相关关系。
两个变量的所属总体都呈正态散布,最少是凑近正态的单峰散布。
两个变量都是由测量所得的连续性数据。
两个变量间的相关是线性相关。
消除共变因素的影响。
计算连续变量或是等间距测度的变量间的相关解析。
Spearman等级相关系数(斯皮尔曼):
Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关解析,对原始变量的散布不做要求,属于非参数统计方法,适用范围要广些。Spearman相关系数相当于Pearson相关系数的非参数形式,它根据数据的秩而不是数据的实际值计算,适用于有序数据和不知足正态散布假设的等间隔数据。Spearman相关系数的取值范围也在(-1,1)之间,绝对值越大相关性越强,取值符号也表示相关的方向。对于听从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。
适用条件:
只有两个变量,且都为序次变量(等级变量),或一列数据是序次变量数据,另一列数据是连续变量数据。
适用于描述称名数据温序次数据的相关情况。
两个连续变量察看的数据,最少有一列数据是由非测量方法大概评估获得的。如使用作品解析法,评论者只能在一定标准基础上,依靠自己的经验进行大概评估。
从Spearman等级相关的使用条件可以看出,其不受样本大小、变量散布形态,数据是否拥有连续
性的条件限制,所以当数据不知足Pearson积差相关的使用条件时,可以使用Spearman等级相关。但Spearman等级相关需将连续性数据变换为序次数据,会遗漏数据原有信息,没有积差相关的正确
度高。所以,当数据吻合积差相关的使用条件时,不要使用等级相关进行计算。