文档介绍:补充材料自相关
1. 非自相关假定
由第2节知回归模型的假定条件之一是,
Cov(ui, uj ) = E(ui uj) = 0, (i, j Î T, i ¹ j), ()
即误差项ut的取值在时间上是相互无关的。称误差项ut非自相关。如果
Cov (ui , uj ) ¹ 0, (i ¹ j)
则称误差项ut存在自相关。
自相关又称序列相关。原指一随机变量在时间上与其滞后项之间的相关。这里主要是指回归模型中随机误差项ut与其滞后项的相关关系。自相关也是相关关系的一种。
自相关按形式可分为两类。
一阶自回归形式
当误差项ut只与其滞后一期值有关时,即
ut = f (ut - 1),
称ut具有一阶自回归形式。
(2) 高阶自回归形式
当误差项ut的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即
ut = f (ut – 1, u t – 2 , …),
则称ut具有高阶自回归形式。
通常假定误差项的自相关是线性的。因计量经济模型中自相关的最常见形式是一阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即
ut = a1 ut -1 + vt ()
其中a1是自回归系数,vt 是随机误差项。vt 满足通常假设
E(vt ) = 0, t = 1, 2 …, T,
Var(vt) = sv2, t = 1, 2 …, T,
Cov(vi, vj ) = 0, i ¹ j, i, j = 1, 2 …, T,
Cov(ut-1, vt) = 0, t = 1, 2 …, T,
依据普通最小二乘法公式,模型()中 a1 的估计公式是,
= ()
其中T是样本容量。若把ut, u t-1看作两个变量,则它们的相关系数是
= ()
对于大样本显然有» ()
把上关系式代入()式得
≈= ()
因而对于总体参数有 r = a1,即一阶自回归形式的自回归系数等于该二个变量的相关系数。因此原回归模型中误差项ut的一阶自回归形式(见模型())可表示为,
ut = r ut-1 + vt. ()
r 的取值范围是[-1,1]。当 r > 0 时,称ut 存在正自相关;当 r < 0时,称ut存在负自相关。当 r = 0时,称ut不存在自相关。 a, c, e, 分别给出具有正自相关,负自相关和非自相关的三个序列。为便于理解时间序列的正负自相关特征, b, d, f, a, c, e, 中变量对其一阶滞后变量的散点图。正负自相关以及非自相关性展现的更为明了。
a. 非自相关的序列图 b. 非自相关的散点图
c. 正自相关的序列图 d. 正自相关的散点图
e. 负自相关的序列图 f. 负自相关的散点图
下面推导当误差项ut为一阶自回归形式时,ut 的期望、方差与协方差公式。由上式有
E(ut) = E(r ut -1 + vt) = r E(ut -1) + E(vt) ()
因为对于平稳序列有E(ut) = E(ut -1),整理上式得
E(ut) = E(vt) / (1- r 2 ) = 0. ()
Var(ut) = E(ut)2 = E(r ut -1 + vt)2 = E(r2 ut –12 + vt2 + 2r ut -1 vt )2 = r2 Var(ut-1) +sv2
整理上式得 Var(ut) = su2 = sv2 / (1- r 2 ) ()
Cov(ut, ut-1) = E(ut ut-1) = E((r ut -1 + vt) ut-1) = r Var(ut-1) = rsu2
同理 Cov(ut, ut-s) = r s Var(ut) = r s su2, (s ¹ 0 ) ()
令 u = (u1 u2 u3 … uT)’,
则由公式(),(),()得
E(u u’) = W = su2 ()
其中su2 = sv2 / (1 - r 2 )。
从而验证了当回归模型的误差项ut存在一阶自回归形式时,Cov(ui, uj) ¹ 0。同理也可证明当ut 存在高阶自回归形式时,仍有Cov(ui, uj) ¹ 0。
注意,(1)经济问题中的自相关主要表现为正自相关(原因见3节)。(2)自相关多发生于时间序列数据中。若出现于截面数据中,称其为空间自相关。
3. 自相关的来源与后果
误差项存在自相关,主要有如下几个原因。
(1) 模型的数