1 / 26
文档名称:

spss第五章 偏相关与详析模型课件.ppt

格式:ppt   大小:2,244KB   页数:26页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

spss第五章 偏相关与详析模型课件.ppt

上传人:yzhlya 2022/11/24 文件大小:2.19 MB

下载得到文件列表

spss第五章 偏相关与详析模型课件.ppt

相关文档

文档介绍

文档介绍:该【spss第五章 偏相关与详析模型课件 】是由【yzhlya】上传分享,文档一共【26】页,该文档可以免费在线阅读,需要了解更多关于【spss第五章 偏相关与详析模型课件 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。*
偏相关与详析模型
1相关分析的概念和相关分析过程
2两个变量间的相关分析
3偏相关分析
4距离分析
5详析模型(以交互分类为例)

研究变量间密切程度的一种常用统计方法
1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。(详见下面)
2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系
3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远
线性相关分析
研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,用r表示。
如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1<r<1,如果x,y变化的方向一致,如身高与体重的关系,则称为正相关,r>0,如果x,y变化的方向相反,如吸烟与肺功能的关系,则称为负相关,r<0;而r=0表示无线性相关,一般地,
|r|>;
|r|;
|r|<;
|r|<;
|r|<,认为不相关
*

在Analyze+Correlate下的三个子菜单:
1、Bivariate--相关分析,计算指定的两个变量间的相关关系,可选择Pearson相关、Spearman和Kendall相关;同时对相关系数进行检验,检验的零假设为:相关系数为0(不相关)。给出相关系数为0的概率
2、Partial--偏相关分析,计算两个变量间在控制了其他变量的影响下的相关关系,对相关系数也进行检验,检验的零假设为:相关系数为0
3、Distance--相似性测度,对变量或观测量进行相似性或不相似性测度
*
2两个变量间的相关分析
两两变量间的相关:包括两个连续变量间的相关(Pearson相关)和两个等级(分类)变量间的秩相关(Spearman和Kendall相关)
菜单:Analyze+Correlate+Bivariate
a、连续变量间的相关:Pearson。
P210Data10-01:1962年-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关分析(income:国民收入,deposit:城乡居民储蓄存款余额,number:序号,year:年份)。比较有用的结果:Pearson相关系数r=.976和其相应的显著性概率Sig=.000(显然国民收入与存款余额之间是高度相关的)
P211Data07-03银行职工的起始工资salbegin和现工资salary与雇员本人各方面条件的关系(年龄age、工作时间jobtime、以前工作经验prevexp):比较有用的结果:Pearson相关系数r和其相应的显著性概率Sig(Pearson相关系数均很小)
*
2两个变量间的相关分析(续)
b、等级(分类)变量间的秩相关:Spearman和Kendall。
P212Data07-03银行职工的起始工资salbegin和现工资salary与雇员的职务等级jobcat、受教育程度educ关系(比较有用的结果:Kendall秩相关系数r和其相应的显著性概率Sig(Kendall秩相关系数均>.5,认为中度相关)
P213Data10-02某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性相关(比较有用的结果:秩相关系数r和其相应的显著性概率Sig(秩相关系数均>.5,认为中度相关)
*
3偏相关分析的概念
线性相关分析计算两个变量间的相关关系,分析两个变量间线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。如身高、体重与肺活量之间的关系。如果使用Pearson相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线性关系。但实际上,如果对体重相同的人,分析身高和肺活量,是否身高越高,肺活量就越大呢?不是的。原因是身高与体重有线性关系,体重与肺活量存在线性关系,因此得出身高和肺活量之间存在着较强的线性关系的错误结论。
偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。
分析身高与肺活量之间的相关性,就要控制体重在相关分析中的影响。实际生活中有许多这样的关系,如可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间的相关关系。可以在控制了销售能力与各种其他经济指标的情况下,研究销售量与广告费用之间的关系等。
*
4距离分析
是对观测量之间或变量之间相似或不相似程度的一种测度,是一种广义的距离。
有关的统计量。
不相似性测度:a、对等间隔(定距)数据的不相似性(距离)测度可以使用的统计量有Euclid欧氏距离、欧氏距离平方等。b、对计数数据使用卡方。c、对二值(只有两种取值)数据,使用欧氏距离、欧氏距离平方、尺寸差异、模式差异、方差等
相似性测度:a、等间隔数据使用统计量Pearson相关或余弦。b、测度二元数据的相似性使用的统计量有20余种。
距离分析分为观测量之间距离分析和变量之间距离分析。
5引进其他变量后的交互分析
引进其他变量,详细分析两个变量之间的关系,因为两个变量之间的关系可能受到其他变量的影响,对于其他变量与这两个变量之间的关系到底怎么样,依据作用的形式,可以分为三种情况:
控制的方法:分类
采用统计控制的方法——也就是用SUB-TABLES的方法来说明,所谓分表就是根据前置变量A的值,把样本的个案分组,然后分析每个组与X与Y之间的关系。假定年龄分为两个组(1:50-65岁以下;2:65岁以上),那么,根据年龄可以分为两个表:65岁以下的人的结婚年数与身体状况;65岁以上的人的结婚年数与身体状况。通过SPSS中得到的CROSSTABS命令,把年龄作为控制变量,就可以对结婚年数与身体状况之间是否真的存在因果关系进行分析。
操作步骤:[1]看要研究的两个现象X与Y之间的交互表
[2]加控制变量(可以是一个或2个)——看分表的相关系数,了解控制变量对现象的影响。
总表
分表相关系数
结论
模式
R
R1=R2=0
虚假相关
A
XY
R
R1=R2=R
真实相关
A
XY
R
R1小于R
R2小于R
部分真实相关
A
XY