1 / 34
文档名称:

多元线性回归与多元逐步回归.ppt

格式:ppt   大小:4,231KB   页数:34页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多元线性回归与多元逐步回归.ppt

上传人:文库新人 2022/3/14 文件大小:4.13 MB

下载得到文件列表

多元线性回归与多元逐步回归.ppt

相关文档

文档介绍

文档介绍:多元线性回归与多元逐步回归
现在学****的是第1页,共34页
例 子
一个应变量与多个自变量间的关系
儿童身高与年龄、性别的关系
肺活量与年龄、性别、身高、体重
以及胸围的呼吸差等因素的关系
多元线性回归
如构ual SS
现在学****的是第14页,共34页
由表11-4可知,F=,P<。从而,拒绝H0,可以认为β1和β2不全为0,即所求回归方程有统计学意义。

H0: β1=β2=0   H1:β1和β2不全为0
=
对表11-3的数据资料,由SAS统计软件可得到如下表11-4的模型检验结果。
现在学****的是第15页,共34页
2.偏回归系数的检验
(1)F 检验
j=1,2,…,k
之中,U 为Xj 的偏回归平方和, 即U= SS回归-SS回归(-j)
Fj服从F(1 ,n - k - 1)分布
现在学****的是第16页,共34页
表11-5 
方程内
自变量
平方和
F
P
SS回归
SS回归-SS回归(-j)
SS残差
X1,X2


X2



<
X1



>
在=,可以认为胰岛素对血糖的线性回归关系有统计学意义,而生长素对血糖的线性回归关系无统计学意义。所以应剔除X2,只建立X1与Y的线性回归方程。
现在学****的是第17页,共34页
(2) t 检验
j=1,2,…,k
,P=;
在α=,认为血糖与胰岛素的线性回归关系
有统计学意义,而与生长素的线性回归关系无统计学意义。
结论与 F 检验一致。
,P=。
现在学****的是第18页,共34页
三、标准化回归系数 (standardized partial regression coefficient)
式中,Sj及Sy 分别为自变量Xj 及因变量Y 的标准差。
可以利用标准化偏回归系数的大小
来反映各自变量的贡献大小。
现在学****的是第19页,共34页
1.复相关系数( multiple correlation coefficient) 又称多元相关系数或全相关系数,表示回归方程中的全部自变量 X共 同对应变量Y的相关密切程度。复相关系数取值总为正值,在0与1之间,简记为R。如果只有一个自变量,此时
四、复相关系数与决定系数
现在学****的是第20页,共34页
2.决定系数(coefficient of determination)  复相关系数的平方又称决定系数,记为 ,用以反映线性回归方程能在多大程度上解释应变量Y的变异性。
回归方程的拟合程度越好,残差平方和就越小,决定系数 越接近1 ,决定系数 越接近1
现在学****的是第21页,共34页
第二节 多元逐步回归 (multiple stepwise regression)
现在学****的是第22页,共34页
1. 多元逐步回归的基本思想
多元逐步回归(multiple stepwise regression)
有三种筛选自变量的方法 :
1.向后法(Backward selection) 先建立一个全因素的回归方程,然后每次剔除一个偏回归平方和最小且无统计学意义的自变量,直到不能剔除时为止,此法的计算量大,有时不能实现。
2.向前法(forward selection) 方程由一个自变量开始,每次引入一个偏回归平方和最大,且具有统计学意义的自变量,由少到多,直到无具有统计意义的因素可以引入为止。用此法建立的方程有时不够精炼。
3. 逐步法(stepwise selecfion) 取上述两种方法的优点,在向前引入每一个新自变量之后都要重新对前已选入的自变量进行检查,以评价其有无继续保留在方程中的价值。为此引入和剔除交替进行,直到无具有统计学意义的新变量可以引入也无失去其统计学意义的自变量可以剔除时为止。
现在学****的是第23页,共34页

每一步只引入或剔除一个自变量。自变量是否被引入或剔除则取决于其偏回归平方和的F检验或校正决定系数。
如方程中已引入了(m-1)个自变量,在此基础上考虑再引入变量Xj 。记引入Xj 后方程(即含m个自变量)的回归平方和为SS回归,残差为SS残差;之前含(m-1)个自变量(不包含Xj )方程的回归