1 / 14
文档名称:

多重回归与自变量的筛选方法.ppt

格式:ppt   大小:877KB   页数:14页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多重回归与自变量的筛选方法.ppt

上传人:石角利妹 2022/3/29 文件大小:877 KB

下载得到文件列表

多重回归与自变量的筛选方法.ppt

相关文档

文档介绍

文档介绍:多重回归与自变量的筛选方法
第一页,讲稿共十四页哦
二、自变量筛选的标准与原则
、残差均方准则

当残差平方和(SSE)最小时,决定系数(R2)达到最大。

多重回归与自变量的筛选方法
第一页,讲稿共十四页哦
二、自变量筛选的标准与原则
、残差均方准则

当残差平方和(SSE)最小时,决定系数(R2)达到最大。

n为样本含量, R2 为包含m个自变量的回归方程的决定系数。 R2是随着变量数的增加而增大,而 不受变量数的影响,
第二页,讲稿共十四页哦
2. CP统计量
n为样本含量,p表示进入模型的自变量个数,m表示所有自变量个数,
表示从全部m个自变量的回归模型中得到的残差均方。
在模型变量个数减少的过程中第一次 值接近p+1时,模型最佳。如果
自变量中没有包含对 Y有主要作用的变量,则不宜用 方法选择自变量。

由Akaike在极大似然基础上提出的,Akaike信息量准则
AIC=n㏑(ssp)-2(p+1)
ssp表示选入模型p个变量的剩余平方和。AIC越小越好。
第三页,讲稿共十四页哦
模型中变量数
调整R2
Cp
变量
1

X1
1

X2
1

X3
2

X1 X2
2

X1 X3
2

X2 X3
3

X1 X2 X3
第四页,讲稿共十四页哦
(press统计量,预测精度)
Press=∑di2 di2=Yi-X‘I
X‘i 表示剔除了所要预测的第i观测值以后所剩余观测值所做估计。
(统计显著性准则)
统计显著性准则:把有统计学意义的变量选入模型,得到的回归模型不一定是最佳预测模型。
三. 逐步回归分析(stepwise regression)
1. 概述
简单地对回归系数作检验,比较复杂;
用前述的几个指标是在所有子集回归中选最优回归模型,而逐步回归是每一步引入或剔除一个变量(其标准是F检验),直到引不进又剔不出为止,建立一个包含所有对因变量有影响的自变量。不是最优回归
第五页,讲稿共十四页哦
二、逐步回归法
方法:向前法(forward )、向后法(backward)、逐步法(stepwise )
每一步只引入或剔除一个自变量准则,是基于对偏回归平方和的F检验
第六页,讲稿共十四页哦
(1)向前法(forward),回归方程中的自变量是一个个进入的,最有统计学意义的变量最先进入,依此类推。即只进不出。
Y对每一个自变量作线性回归,计算各自变量的偏回归平方和,选取偏回归平方和最大者作F检验,有意义(P小)则引入…。
局限性:即后续变量的引入可能会使进入方程的自变量变得不重要。
(2) 向后法(backward),先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。即只出不进。偏回归平方和最小的变量,作F检验及相应的P值,决定它是否剔除(P大) 。重复上述过程。
第七页,讲稿共十四页哦
剔除自变量的方法是在方程中选一个偏回归平方和最小的变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止。理论上最好,建议使用采用此法。
(3)逐步法(stepwise),逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。逐步的把有统计学意义的变量选入模型,也逐步剔除原先无统计学意义的变量。即有进有出。该方法本质上是前进法。
第八页,讲稿共十四页哦

首先确定引入与剔除变量的F统计量标准,~ ,值越小表示选取自变量的标准越严。
注意:引入变量的检验水准要小于或等于剔除变量的检验水准。

(选择不同的a 多做几次,看哪个更合要求)。
,很难建立模型。


第九页,讲稿共十四页哦
五. 回归系数反常分析
㈠ 回归系数的反常现象
1. 回归系数的正负符号与客观实际不一致。
2.