文档介绍:2017-3-8 1统计分析与 SPSS 的应用统计分析与 SPSS 的应用第九章 SPSS 的线性回归分析 2017-3-8 第9章 SPSS 的线性回归分析 2回归分析概述(一)回归分析理解(1) “回归”的含义– galton 研究研究父亲身高和儿子身高的关系时的独特发现. (2) 回归线的获得方式一:局部平均–回归曲线上的点给出了相应于每一个 x(父亲)值的 y(儿子)平均数的估计(3) 回归线的获得方式二:拟和函数–使数据拟和于某条曲线;–通过若干参数描述该曲线; –利用已知数据在一定的统计准则下找出参数的估计值(得到回归曲线的近似); 2017-3-8 第9章 SPSS 的线性回归分析 3回归分析概述(二)回归分析的基本步骤(1) 确定自变量和因变量(父亲身高关于儿子身高的回归与儿子身高关于父亲身高的回归是不同的). (2) 从样本数据出发确定变量之间的数学关系式,并对回归方程的各个参数进行估计. (3) 对回归方程进行各种统计检验. (4) 利用回归方程进行预测. 2017-3-8 第9章 SPSS 的线性回归分析 4线性回归分析概述(三)参数估计的准则–目标:回归线上的观察值与预测值之间的距离总和达到最小–最小二乘法(利用最小二乘法拟和的回归直线与样本数据点在垂直方向上的偏离程度最低) 2017-3-8 第9章 SPSS 的线性回归分析 5一元线性回归分析(一)一元回归方程: – y= β 0+β 1x–β 0为常数项; β 1为y对x回归系数,即:x每变动一个单位所引起的 y的平均变动(二)一元回归分析的步骤–利用样本数据建立回归方程–回归方程的拟和优度检验–回归方程的显著性检验(t检验和 F检验) –残差分析–预测 2017-3-8 第9章 SPSS 的线性回归分析 6一元线性回归方程的检验(一) 拟和优度检验: (1) 目的:检验样本观察点聚集在回归直线周围的密集程度, 评价回归方程对样本数据点的拟和程度。(2) 思路:?因为: 因变量取值的变化受两个因素的影响?自变量不同取值的影响?其他因素的影响?于是: 因变量总变差=自变量引起的+其他因素引起的?即: 因变量总变差=回归方程可解释的+不可解释的?可证明:因变量总离差平方和=回归平方和+剩余平方和 2017-3-8 第9章 SPSS 的线性回归分析 7一元线性回归方程的检验(一) 拟和优度检验: (3) 统计量:判定系数–R 2 =SSR/SST=1-SSE/SST. –R 2体现了回归方程所能解释的因变量变差的比例;1-R 2则体现了因变量总变差中,回归方程所无法解释的比例。–R 2越接近于 1,则说明回归平方和占了因变量总变差平方和的绝大部分比例,因变量的变差主要由自变量的不同取值造成, 回归方程对样本数据点拟合得好–在一元回归中 R 2 =r 2 ; 因此,从这个意义上讲,判定系数能够比较好地反映回归直线对样本数据的代表程度和线性相关性。??????????????? ni i ni ini i ni iyy yyyy yyR 1 2 1 2 1 2 1 22)( ) ?(1)( ) ?( 2017-3-8 第9章 SPSS 的线性回归分析 8一元线性回归方程的检验(二)回归方程的显著性检验:F检验(1) 目的:检验自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示. (2)H 0 : β =0 即:回归系数与 0无显著差异(3) 利用 F检验,构造 F统计量: – F= 平均的回归平方和/平均的剩余平方和~F(1,n-1-1) –如果 F值较大,则说明自变量造成的因变量的线性变动远大于随机因素对因变量的影响,自变量于因变量之间的线性关系较显著(4) 计算 F统计量的值和相伴概率 p (5) 判断– p<=a: 拒绝 H 0,即:回归系数与 0有显著差异,自变量与因变量之间存在显著的线性关系。反之,不能拒绝 H 0 )1 /() ?( /) ?( 2 2??????? knyy kyyF ii i 2017-3-8 第9章 SPSS 的线性回归分析 9一元线性回归方程的检验(三)回归系数的显著性检验:t检验(1) 目的:检验自变量对因变量的线性影响是否显著. (2)H 0: β=0 即:回归系数与 0无显著差异(3) 利用 t检验,构造 t统计量: –其中:S y是回归方程标准误差(Standard Error) 的估计值,由均方误差开方后得到,反映了回归方程无法解释样本数据点的程度或偏离样本数据点的程度–如果回归系数的标准误差较小,必然得到一个相对较大的 t值, 表明该自变量 x解释因变量线性变化的能力较强。(4) 计算 t统计量的值和相伴概率 p (5) 判断 i iiS t ??? 2 2)( ii