文档介绍:SPSS数据分析-第7讲
—?SPSS数据分析教程?
主要内容
相关分析的根本概念
如何绘制各种散点图
三种相关系数的偏相关分析的概念、方法和结果解释
列联表分析
相关分析的根本概念和散点图
什么是相关分析
相关SPSS数据分析-第7讲
—?SPSS数据分析教程?
主要内容
相关分析的根本概念
如何绘制各种散点图
三种相关系数的偏相关分析的概念、方法和结果解释
列联表分析
相关分析的根本概念和散点图
什么是相关分析
相关分析是分析客观事物之间关系的定量分析方法。许多事物或现象之间总是相互联系的,并且可以通过一定的数量关系反映出来。
比方,教育需求量与居民收入水平之间,科研投入与科研产出之间,投资额和国民收入等等,都有着一定的依存关系。
相关关系的种类
相关关系的种类:是否线性
线性相关
正相关
负相关
曲线相关
相关关系的种类:据变量的度量类型
定类变量和定类变量之间的相关
定序变量和定序变量之间的相关
尺度变量和尺度变量之间的相关
相关分析的作用
判断变量之间有无联系
确定相关关系的表现形式及相关分析方法
把握相关关系的方向与密切程度
为进一步采取其他统计方法进行分析提供依据
用来进行预测
散点图
相关散点图是观察两个变量之间关系的一种非常直观的方法。散点图以横轴表示两个变量中的一个变量,以纵轴表示另一个变量,将两个变量之间相对应的变量值以坐标点的形式逐一标在直角坐标系中,通过点的分布形状、分布模式和疏密程度来形象描述两个变量之间的相关关系。
散点图—旧对话框
,它包括车的长、宽、净重等物理指标,同时还有车的厂家、型号、新车售价、发动机、马力、耗油量等。我们想考察车的耗油量是否和售价有关系,是否车越省油价格越高呢?
用图表构建程序绘制散点图
相关系数
通过计算相关系数来分析变量之间相互关系的方法。
计算相关系数的方法很多,由于我们所面对的各种变量都具有不同的性质和类型,因此应当根据变量的特点选择适当的分析相关的方法。对于不同类型的数据,计算相关系数的方法也不相同 。
线性相关的度量—尺度数据间的相关性的度量
Pearson相关系数
相关系数的数值范围是介于–1与 +1之间:
如果|½| ' 0,说明两个变量没有线性相关关系。
如果|½| ' 1 ,那么表示两个变量完全直线相关。线性相关的方向通过相关系数的符号来表示,“+〞号表示正相关,“﹣〞表示负相关。
相关系数为0或接近于0不能说明两个变量之间没有相关性,它只说明没有线性相关性。不能排除具有其它非线性关系。
Pearson 相关系数是一种线性关联度量。如果两个变量关系密切,但其关系不是线性的,那么 Pearson 相关系数就不是适合度量其相关性的统计量。
SPSS的双变量相关可以计算两个或者两个以上变量间的协方差和Pearson相关系数。同时还可以检验该相关系数是否显著区别于0。
设相关系数为½,那么SPSS相关系数检验的原假设为:
H0:|½| =0
,它包括车的长、宽、净重等物理指标,同时还有车的厂家、型号、新车售价、发动机、马力、耗油量等。我们想考察车的耗油量是否和新车售价有关系,是否车越省油价格越高呢?
选择【分析】→【相关】→【双变量】
Spearman等级相关系数—定序变量之间的相关性的度量
斯皮尔曼等级相关的适用条件为:
两个变量为定序变量。
一个变量为定序变量,另一个变量为尺度数据,且两总体不是正态分布,样本容量n不一定大于30。
设D是两个变量每对数据的等级差,n是样本量。 那么Spearman相关系数为:
每周看电视的时间和IQ之间的关系,我们用Spearman等级相关分析二者的相关性。
Kendall的tau-b(K)
Kendall的tau系数是另一种计算定序变量之间或者定序和尺度变量之间相关系数的方法。Spearman的等级相关系数可以方便检验两个定序变量是否相关,但是很难具体解释两个变量如何相关及相关程度。Kendall的等级相关系数可以同时反映两个变量的相关程度。
设样本量为n,考察两个变量X和Y之间的相关关系,X和Y的取值记为xi,yi。所有像(xi,yi)对的个数为n(n-1)/2。和分别表示和的秩次,如果对于任意k,有我们称(xk,yk)为同序对;否那么,称为逆序对。
总的同序对的个数记为nc,逆序对的个数记为nd,那么Kendall的Tau系数的定义为:
偏相关分析
政府医疗基金的投入和发病率之间存在关系吗?尽管您可能希望存在一个负相关的关系,但是它们之间的相