文档介绍:第四章多元线性回归模型检验
拟合优度检验
方程的显著性检验(总参数的F检验)
变量的显著性检验(单参数的t检验)
构造置信区间
拟合优度检验
可决系数与调整的可决系数
1. 总离差平方和的分解
观测值对均值的
分散程度、偏离程度
拟合值对均值的
分散程度、偏离程度
观测值对拟合值的
分散程度、偏离程度
由于
=0
所以有:
有意思的是:
条件:模型必须有截距项
2. 可决系数
该统计量越接近于1,模型的拟合优度越高。
问题:
在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大(?)
这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。
但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。
3. 调整的可决系数
在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:
其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。
一、方程的显著性检验(F检验)
方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。
1、检验假设
即检验模型
Y=1+2X2+ +kXk+
中的参数i是否显著不为0。
可提出如下原假设与备择假设:
H0: 2=3= =k=0
H1: i不全为0
统计推断
F检验的思想来自于总离差平方和的分解式:
TSS=ESS+RSS
如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。
因此,可通过该比值的大小对总体线性关系进行推断。
根据数理统计学中的知识,在原假设H0成立的条件下,统计量
服从自由度为(k-1 , n-k)的F分布
给定显著性水平,可得到临界值F(k-1,n-k),由样本求出统计量F的数值,通过
F F(k-1,n-k) 或 FF(k-1,n-k)
来拒绝或不能拒绝原假设H0,以判定原方程总体上的线性关系是否显著成立。
2. 检验统计量
~
p 值检验法
为了方便起见,将F统计量的值记为F0
计算 p=P{F> F0}
称为p 值(p-value )
如果p> ,则p/2> /2, F0落入不能拒绝域,不能拒绝H0,如果p< ,落入拒绝域,应拒绝H0。
准则:
当P 值小于显著性水平时,方程在给定显著性水平下是显著的
当P 值大于显著性水平时,方程在给定显著性水平下是不显著的。
F0
F
不能拒绝域
拒绝域
由
与
可推出
或