文档介绍:第9章 spss的相关分析和线性回归分析
spss相关分析和线性回归分析
相关分析和回归分析是统计分析方法中最重要内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系,在变量之间寻求合适的函数关系式,特别是线性表达式。
本章主要内容:
对变量之间的相关关系进行分析(Correlate)。其中包括简单相关分析(Bivariate)和偏相关分析(Partial)。
建立因变量和自变量之间回归模型(Regression),其中包括线性回归分析(Linear)和曲线估计(Curve Estimation)。
数据条件:参与分析的变量数据是数值型变量或有序变量。
spss相关分析和线性回归分析
本章内容
相关分析
偏相关分析
线性回归分析
曲线估计
二项Logistic回归
spss相关分析和线性回归分析
相关分析用于测量了解变量之间的密切程度。如:教育事业的发展与科学技术的发展存在着一定的关系,学生的数学成绩与物理成绩存在着一定的关系,相关分析就是要分析这种密切程度。
相关类型:
1、直线相关:两变量呈线性共同增大,或一增一减。
2、曲线相关:两变量存在相关趋势,但非线性。此时若进行直线相关,有可能出现无相关性的结论,曲线相关分析是一般都先将变量进行变量变换,以将趋势变换为直线分析,或者采用曲线回归方法来分析。
相关的方向 依照两种变量变动的方向分,有正相关、负相关和无相关(零相关)。
spss相关分析和线性回归分析
相关分析基本步骤:
spss相关分析和线性回归分析
如果两个定量变量没有关系,就谈不上建立模型或进行回归。但怎样才能发现两个变量有没有关系呢?
最简单的直观办法就是画出它们的散点图。下面是四组数据的散点图;每一组数据表示了两个变量x和y的样本。
第1点
spss相关分析和线性回归分析
不相关
正线性相关
负线性相关
相关但非线性相关
spss相关分析和线性回归分析
但如何在数量上描述相关呢?下面引进几种对相关程度的度量。
Pearson相关系数
Spearman 秩相关系数
Kendall t 相关系数
spss相关分析和线性回归分析
Pearson相关系数(Pearson’s correlation coefficient)又叫相关系数或线性相关系数。它一般用字母r表示。
它是由两个变量的样本取值得到,这是一个描述线性相关强度的量,取值于-1和1之间。当两个变量有很强的线性相关时,相关系数接近于1(正相关)或-1(负相关),而当两个变量不那么线性相关时,相关系数就接近0。
spss相关分析和线性回归分析
Pearson相关系数的局限性:
①要求变量服从正态分布
②只能度量线性相关性,对于曲线相关等更为复杂的情形,该相关系数的大小并不能代表相关性的强弱。如果Pearson系数很低,只能说明两变量之间没有线性关系,并不能说明两者之间没有相关关系。也就是说,该指标只能度量线性相关性,而不是相关性。(线性相关性隐含着相关性,而相关性并不隐含着线性相关性)
另外:样本中存在的极端值对Pearson相关系数的影响极大,因此要慎重考虑和处理,必要时可以对其进行剔出,或者加以变量变换,以避免因为一两个数值导致出现错误的结论。
spss相关分析和线性回归分析