1 / 34
文档名称:

第11章多元线性回归与多元逐步回归.ppt

格式:ppt   大小:1,578KB   页数:34页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第11章多元线性回归与多元逐步回归.ppt

上传人:我是药神 2022/8/12 文件大小:1.54 MB

下载得到文件列表

第11章多元线性回归与多元逐步回归.ppt

相关文档

文档介绍

文档介绍:
第11章多元线性回归与多元逐步回归
手绘风格
两个自变量与应变量的拟合面
bj 为 xj方向的斜率
1. 求偏回归系数bj及b0
根据最小二乘法(method of le血糖与胰岛素的线性回归关系
有统计学意义,而与生长素的线性回归关系无统计学意义。
结论与 F 检验一致。
,P=。
三、标准化回归系数 (standardized partial regression coefficient)
式中,Sj及Sy 分别为自变量Xj 及因变量Y 的标准差。
可以利用标准化偏回归系数的大小
来反映各自变量的贡献大小。
1.复相关系数( multiple correlation coefficient) 又称多元相关系数或全相关系数,表示回归方程中的全部自变量 X共 同对应变量Y的相关密切程度。复相关系数取值总为正值,在0与1之间,简记为R。如果只有一个自变量,此时
四、复相关系数与决定系数
2.决定系数(coefficient of determination)  复相关系数的平方又称决定系数,记为 ,用以反映线性回归方程能在多大程度上解释应变量Y的变异性。
回归方程的拟合程度越好,残差平方和就越小,决定系数 越接近1 ,决定系数 越接近1
第二节 多元逐步回归 (multiple stepwise regression)
1. 多元逐步回归的基本思想
多元逐步回归(multiple stepwise regression)
有三种筛选自变量的方法 :
1.向后法(Backward selection) 先建立一个全因素的回归方程,然后每次剔除一个偏回归平方和最小且无统计学意义的自变量,直到不能剔除时为止,此法的计算量大,有时不能实现。
2.向前法(forward selection) 方程由一个自变量开始,每次引入一个偏回归平方和最大,且具有统计学意义的自变量,由少到多,直到无具有统计意义的因素可以引入为止。用此法建立的方程有时不够精炼。
3. 逐步法(stepwise selecfion) 取上述两种方法的优点,在向前引入每一个新自变量之后都要重新对前已选入的自变量进行检查,以评价其有无继续保留在方程中的价值。为此引入和剔除交替进行,直到无具有统计学意义的新变量可以引入也无失去其统计学意义的自变量可以剔除时为止。

每一步只引入或剔除一个自变量。自变量是否被引入或剔除则取决于其偏回归平方和的F检验或校正决定系数。
如方程中已引入了(m-1)个自变量,在此基础上考虑再引入变量Xj 。记引入Xj 后方程(即含m个自变量)的回归平方和为SS回归,残差为SS残差;之前含(m-1)个自变量(不包含Xj )方程的回归平方和为SS回归(-j) ,则Xj 的偏回归平方和为 U = SS回归-SS回归(-j),检验统计量为:
Fj 服从F (1 ,n - m - 1) 分布
如果Fj>F(1 ,n - m - 1),则 Xj选入方程;否则,不入选。
从方程中剔除无统计学作用的自变量,过程则相反,但检验一样。
3. 多元逐步回归的检验水平
在进行逐步回归前,首先应确定检验水平,以作为引入或剔除变量的标准。检验水平可以根据具体情况而定,一般可将 F 值定在  、。对于回归方程的选入和剔除水平往往选择
选入≤剔除。
选择不同的F 值(或水平),其回归方程的结果可能不一致,一般可选不同的F 值(或值) 作调试。至于何种结果是正确的,必须结合医学的实际意义来确定。

,选入水准为 ,,SAS 软件计算过程及相应结果见表11-8至
表11-11。
多元逐步回归方程为:
第三节 多元线性回归的注意事项
1. 应用条件
(1) 线性依存关系 应变量与自变量间具有线性依存关系。
(2) 正态性 应变量原则上是连续型可测正态变量,其预测值与实际观测值的差值(即残差)服从正态分布,当样本量较大时可以忽略正态性的要求。
(3)独立性 观察单位之间是独立的,即应变量的观测值相互独立。
2. 样本含量 一般应使样本量是自变量个数的 5 倍以上。