文档介绍:多元线性回归模型的置信区间问题包括
参数估计量的置信区间
被解释变量预测值的置信区间
§ 多元线性回归模型的置信区间
可知参数是随机变量的函数,且也是随机变量。
在多次重复抽样中,每次的样本观测值不可能完全相
同,所以得到的点估计值也不可能相同。
在数理统计学中属于区间估计问题
即研究用未知参数的点估计值(从一组样本观测值算得)作为近似值的精确程度和误差范围。
一、参数估计量的置信区间
由
若用参数估计量的一个点估计值近似代表参数值,
那么二者的接近程度如何?
以多大的概率达到该接近程度?
这就是以点估计值为中心的置信区间,它以一定的概率(置信度)包含该参数。
在变量的显著性检验中已经知道
~
于是得到,在(1-)的置信度下j的置信区间:
我们希望置信度越高越好,置信区间越小越好。
如何缩小置信区间:
增大样本容量n。
在同样置信度下,n越大,从t分布表中查得自由度
(n-k)的临界值t越小;同时,增大样本容量,在一般
情况下可使
减小(分母肯定增大,分子不一定)。
2) 提高模型的拟合优度,以减小残差平方和e´e。
设想一种极端情况,若模型完全拟合样本观测值,残差平方和为0,则置信区间长度也为0。
3) 提高样本观测值的分散程度。
通常,样本观测值越分散,cjj越小。
置信度与置信区间是矛盾的。
在其他情况不变时,置信度越高,临界值t越大,置信区间越大。
如果要求缩小置信区间,在其他情况不变时,就必须降低对置信度的要求。
二、预测值的置信区间
计量经济学的一个重要应用是经济预测。
预测是建立在多元线性回归模型 Y=XB+U 在预测
期或预测范围内仍然成立的基础上的。
无论对于时间序列模型,还是对于截面数据模型,
预测的基本前提都是由样本得到的统计规律不发生太大
变化,原有回归模型的假设条件仍然成立。
假设在预测期或预测范围内,关系式 Y0=X0B+u0 成立。
其中, Y0是要预测的数值, X0是给定的解释变量矩阵:
X0=(1 X20 X30 … Xk0),
u0为预测期的误差项。
u0仍然满足经典假设条件
~
~
Y0也服从正态分布,
把样本回归方程扩大定义范围,就可以得到
严格地说,上式得到的
只是被解释变量的预测值的
估计值,也是E(Y0)的点估计值,而不是预测值。
原因:
模型中的参数估计量是不确定的;
随机误差项的影响。
所以,我们得到的仅是预测值的一个估计值,预测值
仅以某一个置信度处于以该估计值为中心的一个区间
中。
为了进行预测,还要分别得到E(Y0)和Y0的置信区间。
E(Y0)的置信区间
~
~
在给定了置信度(1-)之后,E(Y0)的(1-)置信区间为
2. Y0的预测区间
预测误差为:
= 0
标量