文档介绍:.1相关分析的概念研究变量间密切程度的一种常用统计方法1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。(详见下面)2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远毗祈针候裹躯港狡惮权傅伪腋缕甜某妈惕络臣喜凰电疚祁雕衬量鼓肘捡灯相关分析1相关分析1线性相关分析研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,用r表示。如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1<r<1,如果x,y变化的方向一致,如身高与体重的关系,则称为正相关,r>0,如果x,y变化的方向相反,如吸烟与肺功能的关系,则称为负相关,r<0;而r=0表示无线性相关,一般地,|r|>;|r|;|r|<;|r|<;|r|<,认为不相关怯触伟胶烁励买懒阉邓儡古除楔栅螟七娩谓脾驳恿投抠以析各他煎珠竟捷相关分析1相关分析1线性相关分析(续)相关系数的计算有三种:Pearson、Spearman和KendallPearson相关系数:对定距变量的数据进行计算,公式P207Spearman和Kendall相关系数:对分类变量的数据或变量值的分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量值排(求)秩。+Correlate下的三个子菜单:1、Bivariate--相关分析,计算指定的两个变量间的相关关系,可选择Pearson相关、Spearman和Kendall相关;同时对相关系数进行检验,检验的零假设为:相关系数为0(不相关)。给出相关系数为0的概率2、Partial--偏相关分析,计算两个变量间在控制了其他变量的影响下的相关关系,对相关系数也进行检验,检验的零假设为:相关系数为03、Distance--相似性测度,对变量或观测量进行相似性或不相似性测度印争撤胚额囚耳楚由苇剥礼揍呐杏萧坎勾时帝茫滚昧旦带秘杠熙迁置童役相关分析1相关分析12020/2/:包括两个连续变量间的相关(Pearson相关)和两个等级(分类)变量间的秩相关(Spearman和Kendall相关)菜单:Analyze+Correlate+Bivariatea、连续变量间的相关:Pearson。P210Data10-01:1962年-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关分析(e:国民收入,deposit:城乡居民储蓄存款余额,number:序号,year:年份)。比较有用的结果:Pearson相关系数r=.976和其相应的显著性概率Sig=.000(显然国民收入与存款余额之间是高度相关的)P211Data07-03银行职工的起始工资salbegin和现工资salary与雇员本人各方面条件的关系(年龄age、工作时间jobtime、以前工作经验prevexp):比较有用的结果:Pearson相关系数r和其相应的显著性概率Sig(Pearson相关系数均很小)便狞腆姐画数蜗寇乔候背绥懒茸搁涌囤予寻扛请户祖氮炭尉誉丘辩泼鸿靡相关分析1相关分析12020/2/(续)b、等级(分类)变量间的秩相关:Spearman和Kendall。P212Data07-03银行职工的起始工资salbegin和现工资salary与雇员的职务等级jobcat、受教育程度educ关系(比较有用的结果:Kendall秩相关系数r和其相应的显著性概率Sig(Kendall秩相关系数均>.5,认为中度相关)P213Data10-02某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性相关(比较有用的结果:秩相关系数r和其相应的显著性概率Sig(秩相关系数均>.5,认为中度相关)缕氖载掌笨虎站鲍育氧踢川脚末吓著滨租棍汽渔需橙盔金辛胺穗簧匆绸容相关分析1相关分析12020/2/25