1 / 28
文档名称:

回归分析(3)多元逐步回归ppt课件.ppt

格式:ppt   大小:307KB   页数:28页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

回归分析(3)多元逐步回归ppt课件.ppt

上传人:相惜 2021/3/14 文件大小:307 KB

下载得到文件列表

回归分析(3)多元逐步回归ppt课件.ppt

文档介绍

文档介绍:§ 多元逐步回归算法原理
多元回归模型首先将实际问题所提取的全部变量引入方程,然后再根据变量的显著性检验把方程中不重要的变量逐一剔除,建立新方程。
缺点:(1)首先在实际问题中,要提取合适的变量来建立回归方程本身不是一件很容易的事情,变量间可能存在高度的相互依赖性会给回归系数的估计带来不合理的解释;
(2)其次变量的一次性引入方程,易导致计算量增大,运算效率降低,精度不够等问题。
1
精选ppt
为了得到一个稳健的、可靠的回归模型,这就需要给出一种方法,使得能从影响 的因素中自动根据某种准则将 对 贡献大的变量 (或者说对 重要的变量 )引入方程,不重要的变量从方程中剔除。最终在观测数据基础上建立最优的回归方程。
§ 多元逐步回归算法原理
2
精选ppt
§ 逐步回归算法的形成思路
逐步回归算法基本思路
根据各自变量的重要性,每一步选一个重要的变量进入回归方程。
第一步是在所有可供挑选的变量中选出一个变量,使它组成的一元回归方程比其他变量有更大的回归平方和。第二步是在剩下的自变量中选这样一个变量,它与已选入方程的那个变量所组成的二元回归方程,比其他任一变量与已先选入方程的变量所组成的二元回归方程,有更大的回归平方和。
3
精选ppt
如此继续下去,假设已经进行到 步,那第 步是在未选的变量中选出这样一个变量,它与已选入回归方程的变量组成 元回归方程,比其他余下的任何一个变量组成的 元回归方程,有更大的回归平方和。
逐步回归不仅考虑到按贡献大小逐一挑选重要变量,而且还考虑到较早选入回归方程的某些变量,有可能随着其后一些变量的选入而失去原有的重要性,这样的变量也应当及时从回归方程中剔除,使回归方程中始终只保留重要的变量。
§ 逐步回归算法的形成思路
4
精选ppt
如 引入方程后,再引入 ,也许由 的引
入而 的重要性反而变得不重要,应及时剔除。
假设已有 个自变量引入回归方程,即已知回
归方程是:
此时该方程相应的总离差平方和记为
()
§ 逐步回归算法的形成思路
5
精选ppt
§ 引入自变量的依据
现在在已有的 个自变量所组成的回归方程中再
引入一个自变量,不妨记为 ,于
是引入了一个自变量 的回归方程可表示为
现在用式()减去式(),并注意到
式()与式()总离差平方和不变,
可得
()
6
精选ppt

于是称 为自变量 对因变量 的方
差贡献。也就是,如果 越大,则
对 的影响就越大, 对回归方程就越显重要,应该引入。但是 应大到什么程度,自变量 才可被引入方程呢?这就需要给出 的引入标准(或称引入门坎值)。
7
精选ppt
统计理论表明,用统计量
可以检验自变量 是否可以引入方程。式中, 是样本容量, 是已进入方程的自变量个数。
对于给定水平 ,查 分布表,可得临界
值 。如果 ,则表明 可引入方程;
8
精选ppt
如果 ,则说明自变量 不重要, 不能引
入方程。需要说明的是,实际问题可能 有
多个,由于每次只能引入一个变量进入方程,因
此在算法上,我们是选最大的 值所对应的变量
考虑引入,即,先求
然后将它与 比较,如 ,相应的自变量
入选;如 ,引入变量的步骤就到此为
止。
9
精选ppt
§ 剔除自变量的依据
设已有 个自变量引入回归方程,即已知回归方
程为
此时该方程的总离差平方和可表示为

现在已有的 个自变量中剔除一个自变量,不妨
剔除 ,于是可得剔除自变量 后的
回归方程,记为
()
()
10
精选ppt