1 / 52
文档名称:

第9章spss的相关分析和线性回归分析.ppt

格式:ppt   大小:1,352KB   页数:52页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第9章spss的相关分析和线性回归分析.ppt

上传人:我是药神 2022/4/23 文件大小:1.32 MB

下载得到文件列表

第9章spss的相关分析和线性回归分析.ppt

相关文档

文档介绍

文档介绍:第9章spss的相关分析和线性回归分析
但如何在数量上描述相关呢?下面引进几种对相关程度的度量。
Pearson相关系数
Spearman 秩相关系数
Kendall t 相关系数
Pearson相关系数(Pearson’s很容易得出身高与肺活量存在较强线性关系的错误结论。
偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。分析身高与肺活量之间的相关性,就要控制体重在相关分析中的影响。正确运用偏相关分析,可以解释变量间的真实关系,识别干扰变量并寻找隐含的相关性。
偏相关系数的计算
控制了变量z,变量x、y之间的偏相关系数和控制了两个变量 ,变量x、y之间的偏相关系数分别为
是控制了z的条件下,x、y之间的偏相关系数。 是变量x、y间的简单相关系数。
偏相关系数的检验
检验的零假设:两个变量间的偏相关系数为0。使用t检验,公式如下:
r是相应的偏相关系数。n是观测个数,k是控制变量的数目,n-k-2是自由度。
在SPSS的偏相关分析过程的输出中只给出偏相关系数和假设成立的概率p值。
偏相关分析的操作
与简单相关分析操作类似,只不过菜单为Analyze→Correlate→Partial
实例:利用数据相关回归分析(高校科研研究).sav,分析发表立项课题数与论文数之间的偏相关关系,其中投入高级职称的人数为控制变量。
练****利用数据data10-,分析中山柏月生长量与4个气候因素哪个因素有关。
本章内容
相关分析
偏相关分析
线性回归分析
曲线估计
二项Logistic回归
线性回归分析
线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象 (因变量)与影响因素(自变量)之间的线性函数关系式。由于多元线性回归的计算量比较大,所以有必要应用统计分析软件实现。这一节将专门介绍SPSS软件的线性回归分析的操作方法,包括求回归系数,给出回归模型的各项检验统计量值及相应的概率,对输出结果的分析等相关内容。
线性回归模型假设条件与模型的各种检验
1、线性回归的假设理论
(1)正态性假设:即所研究的变量均服从正态分布;
(2)等方差假设:即各变量总体的方差是相等的;
(3)独立性假设, 即各变量之间是相互独立的;
(4)残差项无自相关性,即误差项之间互不相关,
Cov(i,j)= 0
2、线性回归模型的检验项目
(1)回归系数的检验(t检验)。
(2)回归方程的检验(F检验)。
(3)拟合程度判定(可决系数R2 )。
(4)(残差项是否自相关)。
(5)共线性检验(多元线性回归)。
(6)残差图示分析(判断异方差性和残差序列自相关)。
对初三和高一的各科平均成绩这两个变量的数据进行线性回归,就是要找到一条直线来适当地代表图中的那些点的趋势。
首先需要确定选择这条直线的标准。这里介绍最小二乘回归(least squares regression)。古汉语“二乘”是平方的意思。
这就是寻找一条直线,使得所有点到该直线的竖直距离的平方和最小。用数据寻找一条直线的过程也叫做拟合(fit)一条直线。
根据计算,找到初三成绩和高一成绩的回归直线。计算机输出给出来截距(Constant)(变量j3的系数) 。
截距=; 斜率=
这个直线实际上是对所假设的下面线性回归模型的估计(这里的e 是随机误差):
我们得到的截距和斜率()是对b0和b1的估计。
由于不同的样本产生不同的估计,所以估计量是个随机变量,它们也有分布,也可以用由他们构造检验统计量来检验b0和b1是不是显著。拿回归主要关心的来说,假设检验问题是
计算机输出也给出了这个检验:,而p-。
除了对b1的检验之外,还有一个说明自变量解释因变量变化百分比的度量,叫做决定系数(coefficient of determination,也叫测定系数或可决系数),用R2表示。
R2 =;这说明这里的自变量可以大约解释63%的因变量的变化。R2越接近1,回归就越成功。由于R2有当变量数目增加而增大的缺点,人们对其进行修改;有一修正的R2(adjusted R square)。
此外,计算机还计算了一个在零假设下有F分布的检验统计量,它是用来检验回归拟合好坏的(零假设是因变量和自变量没有关系)。
和刚才简单的回归模型类似,一般的有k个(定量)自变量x1, x2…, xk的对因变量y的线性回归模型为