文档介绍:§ 一元线性回归分析的应用:预测问题
一、Ŷ0是条件均值E(Y|X=X0)或个值Y0的一个无偏估计
二、总体条件均值与个值预测值的置信区间
对于一元线性回归模型
给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0 ,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。
注意:
严格地说,这只是被解释变量的预测值的估计值,而不是预测值。
原因:(1)参数估计量不确定;
(2)随机项的影响
一、Ŷ0是条件均值E(Y|X=X0)或个值Y0的一个无偏估计
对总体回归函数E(Y|X=X0)=0+1X,X=X0时
E(Y|X=X0)=0+1X0
于是
可见,Ŷ0是条件均值E(Y|X=X0)的无偏估计。
对总体回归模型Y=0+1X+,当X=X0时
于是
二、总体条件均值与个值预测值的置信区间
1、总体均值预测值的置信区间
由于
于是
可以证明
因此
故
其中
于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为
2、总体个值预测值的预测区间
由 Y0=0+1X0+知:
于是
式中:
从而在1-的置信度下, Y0的置信区间为
在上述收入-消费支出例中,得到的样本回归函数为
则在 X0=1000处, Ŷ0 = –+×1000=
而
因此,总体均值E(Y|X=1000)的95%的置信区间为:
-< E(Y|X=1000) <+
或(, )
同样地,对于Y在X=1000的个体值,其95%的置信区间为:
- <Yx=1000 < +
或(, )
总体回归函数的置信带(域)(confidence band)
个体的置信带(域)
对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间):
(1)样本容量n越大,预测精度越高,反之预测精度越低;
(2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。