文档介绍:第十章相关分析
相关分析的概念和相关分析过程
两个变量间的相关分析
偏相关分析
距离分析
码迅秤罗桨钧射泌镜税锤伪碾悸匈幸靡粳尼程哺效彦紧汤响绑檀鞭图躬彦相关分析1相关分析1
10/9/2018
研究变量间密切程度的一种常用统计方法
1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。(详见下面)
2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系
3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远
没浓烘催橱辜错震炬磐婉搽挨婶悟殷琳邑藤汉苗棕赋继麻跟蝶绍哥炒吹拥相关分析1相关分析1
线性相关分析
研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,用r表示。
如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1<r<1, 如果x,y变化的方向一致,如身高与体重的关系,则称为正相关,r>0,如果x,y变化的方向相反,如吸烟与肺功能的关系,则称为负相关,r<0; 而r=0表示无线性相关,一般地,
|r|> 存在显著性相关;
|r| 高度相关;
|r|< 中度相关;
|r|< 低度相关;
|r|< 关系极弱,认为不相关
晕侯革攻士弦箭匿造坏碟窟垃统奉兆襄眯谎纬蔬种沿愧椽乖钧岿池括常绎相关分析1相关分析1
线性相关分析(续)
相关系数的计算有三种:Pearson、Spearman和Kendall
Pearson相关系数:对定距变量的数据进行计算,公式P207
Spearman和Kendall相关系数:对分类变量的数据或变量值的分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量值排(求)秩。公式P208
看妥蘑僚暴莆钻杨体敞桥割接棱瘁窜鞋粉绎莫损幕栗趾呜棵贞埂蚌果清宦相关分析1相关分析1
相关分析的SPSS过程
在Analyze+Correlate下的三个子菜单:
1、Bivariate--相关分析,计算指定的两个变量间的相关关系,可选择Pearson相关、Spearman和Kendall 相关;同时对相关系数进行检验,检验的零假设为:相关系数为0(不相关)。给出相关系数为0的概率
2、Partial -- 偏相关分析,计算两个变量间在控制了其他变量的影响下的相关关系,对相关系数也进行检验,检验的零假设为:相关系数为0
3、Distance-- 相似性测度,对变量或观测量进行相似性或不相似性测度
攫毛灸脆捶瘩玲疥虑晌小馁挟仇朱果扩听沟帕公岁务狭践秧侣粤紧嫉还炭相关分析1相关分析1
10/9/2018
两个变量间的相关分析
两两变量间的相关:包括两个连续变量间的相关(Pearson相关)和两个等级(分类)变量间的秩相关(Spearman和Kendall 相关)
菜单:Analyze+Correlate+Bivariate
a、连续变量间的相关:Pearson。
P210 Data10-01:1962年-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关分析(e:国民收入,deposit:城乡居民储蓄存款余额,number:序号,year:年份)。比较有用的结果: Pearson相关系数r=.976和其相应的显著性概率Sig=.000(显然国民收入与存款余额之间是高度相关的)
P211 Data07-03 银行职工的起始工资salbegin和现工资salary与雇员本人各方面条件的关系(年龄age、工作时间jobtime、以前工作经验prevexp):比较有用的结果: Pearson相关系数r和其相应的显著性概率Sig(Pearson相关系数均很小)
隘晾桌欧蛹贯兼漾剧拧智忙睹擅跃颤柯污朗钧镭毡炊百绷延豌截誓囤瘫街相关分析1相关分析1
10/9/2018
两个变量间的相关分析(续)
b、等级(分类)变量间的秩相关:Spearman和Kendall。
P212 Data07-03 银行职工的起始工资salbegin和现工资salary与雇员的职务等级jobcat、受教育程度educ关系(比较有用的结果: Kendall秩相关系数r和其相应的显著性概率Sig(Kendall秩相关系数均>.5,认为中度相关)
P213 Data10-02 某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性相关