1 / 64
文档名称:

多元线性回归.ppt

格式:ppt   大小:1,017KB   页数:64页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

多元线性回归.ppt

上传人:放射辐射 2022/6/11 文件大小:1017 KB

下载得到文件列表

多元线性回归.ppt

相关文档

文档介绍

文档介绍:多元线性回归
二、多元线性回归模型的基本假设
►假设1:解释变量是非随机的或固定的,且各X之间互不相关(无多重共线性)。
►假设2:随机误差项具有零均值、同方差和无序列相关性:
E(i期望为β
有效性的证明 → 方差表达式
2、记 C=(X’X)-1 的第 j 个主对角元素为 Cjj(j=0,1,…,k),则:
三、样本容量问题
最小样本容量
满足基本要求的样本容量
1、最小样本容量
所谓“最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。
样本最小容量必须不少于模型中解释变量的数目(包括常数项),即:n  k+1
因为,无多重共线性要求:秩(X)=k+1
2、基本样本容量
从统计检验的角度:
n30 时,Z检验才能应用;
n-k  8时, t分布较为稳定
一般经验认为:
当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。
模型的良好性质只有在大样本下才能得到理论上的证明
§ 多元线性回归模型的统计检验
一、拟合优度检验
二、方程显著性检验
三、变量显著性检验
一、拟合优度检验
目的:测定样本回归函数对样本观测值的拟合紧密程度
指标:R2、Adj(R2)
可决系数R2 (coefficient of determination)
0<R2<1,该统计量越接近于1,模型的拟合优度越高。
1、定义:
2、问题:
在模型中增加一个解释变量, R2往往增大
但是:增加解释变量个数往往得不偿失,不重要的变量不应引入。
增加解释变量使得估计参数增加,从而自由度减小。如果引入的变量对减少残差平方和的作用很小,这将导致误差方差σ2的增大,引起模型精度的降低。
因此:R2需调整。
调整的可决系数Adj(R2) (adjusted coefficient of determination)
1、调整思路:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。
2、自由度:统计量可自由变化的样本观测值的个数,记为df
TSS:df=n-1
ESS:df= k
RSS:df= n-k-1
注意:
df(TSS)=df(ESS)+df(RSS)
3、定义:
# Adj(R2)的作用
1、消除拟合优度评价中解释变量的多少对拟合优度的影响
2、对于因变量Y相同,而自变量X个数不同的模型,不能用R2直接比较拟合优度,而应使用Adj(R2) 。
3、可以通过Adj(R2)的增加变化,决定是否引入一个新的解释变量。
Adj(R2)<= R2,即:调整可决系数不大于未经调整的可决系数。随着解释变量的增加,二者的差异越来越大。
# Adj(R2)与R2的关系
*赤池信息准则和施瓦茨准则* (AIC&SC)
用于比较因变量相同,解释变量个数不同的多元回归模型的拟合优度
※ 赤池信息准则(Akaike information criterion, AIC)
※ 施瓦茨准则(Schwarz criterion,SC)
这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量。
二、方程的显著性检验(F检验)
目的:检验Y与所有X的线性关系在总体上是否成立
方法:F检验
1、原假设和备择假设
检验模型中的参数j是否至少有一个显著不为0。
Yi=0+1X1i+2X2i+  +kXki+i i=1,2,,n
原假设与备择假设:
H0: 0=1=2=  =k=0
H1: j不全为0
2、检验统计量
可以证明,在原假设H0成立的条件下:
F~ F (k , n-k-1)
其中:k为模型中解释变量个数
3、检验步骤
(1)提出原假设和备择假设:
H0: 0=1=2=  =k=0
H1: j不全为0
(2)在H0成立的条件下,计算检验统计量的值:
(3)给定显著性水平,可得到临界值:F(k,n-k-1)
右侧检验
(4)如果 F F(k,n-k-1),拒绝原假设,总体线性关系成立
如果 F F(k,n-k-1),接受原假设,总体线性关系不成立
# 拟合优度和方程显著性检验
在中国居民人均收入-消费一元模型中,
在中国居民人均收入-消费二元模型中,
可见:一个显著的模型并不意味着拟合优度一定很高
注意到F检验是一个严格的统计检验,因此实际中要多参考这一检验的结果。
示例:
三、变量的显著性