文档介绍:第六章相关分析一、相关分析的概念相关分析是研究变量间密切程度的一种常用统计方法。线性相关分析研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量, 通常用 r表示。相关系数 r没有单位;其值在-1~ +1 之间。当数值愈接近-l或+1 之间时,关系愈紧密,接近于0时,关系愈不紧密。对其数值可以从小到大排列的数据才能计算其相关系数。例如不能计算宗教信仰与颜色喜好之间的关系。二、相关系数积矩相关系数( Pearson 相关系数) Spearman 和 Kendall 秩相关系数偏相关系数 1、积矩相关系数( Pearson 相关系数) 积矩相关系数(又称积差相关系数)适用于等间隔测度, 相关系数采用 Pearson 积矩相关。??????????? ni ni ni i i xyyyxx yxR i i yx 11 2 2 1)()( ) )((2、 Spearman 和 Kendall 秩相关系数 Spearman 和 Kendall 秩相关系数是一种非参测度,是根据秩而不是根据实际值计算的秩相关适用于下列资料不服从双变量正态分布; 总体分布型未知; 用等级表示的资料。 Spearman 和 Kendall 秩相关系数 Spearman 相关系数是 Pearson 相关系数的非参形式。是根据数据的秩而不是根据实际值计算的。也就是说, 先对原始变量的数据排秩,根据各秩使用相关系数公式进行计算。它适合有序数据或不满足正态分布假设的等间隔数据。相关系数的值范围也是在-1~ +1 之间。绝对值越大表明相关越强。相关系数的符号也表示相关的方向。这两种相关系数的计算必须对连续变量值排秩,对离散变量排序。 Spearman 和 Kendall 秩相关系数例如,我们可以将一组学生按入学考试成绩和第一学年结业成绩的顺序排队。如果将入学考试成绩的评秩记为 X 1 ,X 2 ,X n,而学年结业成绩的评秩记为 Y 1,Y 2, Y n,我们就可以用秩相关度量来决定 X和Y之间的相关性。??????????? ni ni ni i iSS RR SR i i SR 11 2 2 1)()( ) )((? Ri为第 i个X值的秩, Si为第 i个Y值的秩。 Spearman 和 Kendall 秩相关系数 Kendall ‘s tau-b 也是一种对两个有序变量或两个秩变量间的关系程度的测度,因此也属于一种非参测度。以一个例子来进行 Kendall 秩相关系数的计算。如果两位鉴定家各自以吸引力的大小将 7幅抽象派画评定了秩,那么可能知道这些秩评定之间的相符的程度。依次取观测 2(鉴别家 2)给出的秩,数出每一个右面在秩次上比自己小的个数,并将这些个数加起来。例如抽象画 2的秩为 2,其个数是 1,因为其右边的只有抽象画 5 的秩比它小。 6个数依次为 1,1,0,0,1和0,所以总和为 Q=3, Kendall 秩相关系数则为: R=1-4Q/n(n-1)=1-12/42= 7564132鉴别家 2 7654321鉴别家 1 7341562画号3、偏相关系数偏相关系数描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性。例如:可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间的相关关系。控制了变量 Z,变量 X与Y之间的偏相关,和控制了两个变量 Z1 、 Z2 ,变量 X与Y之间的偏相关系数计算公式不同。