文档介绍:第9章 spss 的相关分析和线性回归分析?相关分析和回归分析是统计分析方法中最重要内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系, 在变量之间寻求合适的函数关系式,特别是线性表达式。?本章主要内容: ?对变量之间的相关关系进行分析( Correlate )。其中包括简单相关分析( Bivariate )和偏相关分析( Partial )。?建立因变量和自变量之间回归模型( Regression ), 其中包括线性回归分析( Linear )和曲线估计(Curve Estimation )。?数据条件:参与分析的变量数据是数值型变量或有序变量。本章内容? 相关分析? 偏相关分析? 线性回归分析? 曲线估计? 二项 Logistic 回归?相关分析用于测量了解变量之间的密切程度。如:教育事业的发展与科学技术的发展存在着一定的关系,学生的数学成绩与物理成绩存在着一定的关系,相关分析就是要分析这种密切程度。?相关类型: 1、直线相关:两变量呈线性共同增大,或一增一减。 2、曲线相关:两变量存在相关趋势,但非线性。此时若进行直线相关,有可能出现无相关性的结论,曲线相关分析是一般都先将变量进行变量变换,以将趋势变换为直线分析,或者采用曲线回归方法来分析。?相关的方向 依照两种变量变动的方向分,有正相关、负相关和无相关(零相关)。相关分析基本步骤: ????如果两个定量变量没有关系,就谈不上建立模型或进行回归。但怎样才能发现两个变量有没有关系呢? ?最简单的直观办法就是画出它们的散点图。下面是四组数据的散点图;每一组数据表示了两个变量x和y的样本。第1点-3 -2 -1 0 1 2 -2 -1 0 1 2 (a) x y -2 -1 0 1 2 -2 -1 0 1 2 (b) x y -2 -1 0 1 2 -2 -1 0 1 2 (c) x y -3 -2 -1 0 1 2 3 0 2 4 6 8 (d) x y不相关正线性相关负线性相关相关但非线性相关?但如何在数量上描述相关呢?下面引进几种对相关程度的度量。? Pearson 相关系数? Spearman 秩相关系数? Kendall ?相关系数?Pearson 相关系数(Pearson ’s correlation coefficient )又叫相关系数或线性相关系数。它一般用字母 r表示。 2 2)()( ) )((yyxx yyxxr?????????它是由两个变量的样本取值得到,这是一个描述线性相关强度的量,取值于-1和1之间。当两个变量有很强的线性相关时,相关系数接近于 1(正相关)或-1(负相关),而当两个变量不那么线性相关时,相关系数就接近 0。 Pearson 相关系数的局限性: ①要求变量服从正态分布②只能度量线性相关性,对于曲线相关等更为复杂的情形,该相关系数的大小并不能代表相关性的强弱。如果 Pearson 系数很低,只能说明两变量之间没有线性关系,并不能说明两者之间没有相关关系。也就是说,该指标只能度量线性相关性,而不是相关性。(线性相关性隐含着相关性,而相关性并不隐含着线性相关性) 另外:样本中存在的极端值对 Pearson 相关系数的影响极大, 因此要慎重考虑和处理,必要时可以对其进行剔出,或者加以变量变换,以避免因为一两个数值导致出现错误的结论。