文档介绍:第八章多重共线性
上海立信会计学院
实践中很少遇到完全多重共线性的情况,常常是接近或高度多重共线性,即解释变量是近似线性相关的。
本章内容主要包括:
?
?
?
?
一、多重共线性的性质
例子:下表中给出了产品需求(Y)、价格(X2)以及消费者收入的两组数据,X3,X4。为了区别,前者称为收入,后者称为工资。
表1 对产品的需求
分别估计一下两个模型。依据理论,预计A2和B2为负,而A3和B3为正。
但当用上表数据拟合回归式(1)时,计算机“拒绝”估计模型。为什么呢? 作价格对收入的关系图:
收入与价格的散点图
如果做X3对X2回归,得到如下结果:
结果显示,收入变量和价格变量完全线性相关,即完全共线性。如果把方程(3)代入方程(1)中,得到:
从方程(4)可以看出,这并不是多元回归,而是Y对X2的一元回归。虽然可以估计出C1和C2的值,但根据这些变量却无法求的原始参数A1,A2,和A3的估计值。
利用表1数据对方程4回归得到如下结果:
, 。但无法根据这两个值推出3个未知变量、和的值。
总结:当解释变量之间完全共线性时,不可能得到所有参数的唯一估计值,因而也就不能根据样本进行任何统计推断。
定义:共线性程度很高,但不是完全共线性的情况就称为接近,或不完全,或高度多重共线性。
注意:从现在起,我们所说的多重共线性是指不完全多重共线性。
另一个例子,用工资作为收入变量进行回归,结果如下:
分析这个结果,我们有如下结论:
(a)虽然不能估计包含收入的模型(1),但能估计回归方程(6),尽管两种收入变量之间的差别很小。
(b)与预期相同,方程(5)中和方程(6)中的价格系数都是负的,并且两者之间的差异不大。每一价格系数都显著不为零。
(c)方程(5),而方程(6)。可以证明R2的增值是统计不显著的。
(d)收入(工资)的系数是统计不显著的,但更重要的是它的符号是错误的。
(e)尽管收入变量是不显著的,但若假设B2=B3=0,则根据F检验很容易拒绝零假设。换句话说,价格和工资同时对商品的需求有显著影响。
如何解释这些奇怪的现象?
首先做价格对工资的关系图。然后做价格和工资的回归,结果如下:
价格和工资的散点图
图形和回归结果表明,尽管价格和工资并不是完全线性关系,但两个变量之间却存在高度相关性,相关系数为-(即的负平方根)
二、多重共线性的理论后果
首先,在古典线性回归模型(CLRM)的假定下,即使存在变量之间的多重共线性,OLS估计量仍然是最优线性无偏估计量,即使多元回归方程的一个或多个偏回归系数是统计不显著的。
其次,多重共线性通常是一个样本特有的现象。我们之所以依然讨论多重共线性,是因为:
,尽管OLS估计量仍然是无偏的,但无偏性是一个重复抽样性质,不是单个样本估计值的性质。
,但这并不意味着任何一个样本的OLS估计量的方差会很小。从方程(6)可以看出,与收入系数的估计值相比,样本方差很大,以至于计算的t值仅有-。因而接受假设。
,但可能与某一样本线性相关。
三、多重共线性的实际后果
在接近或者高度多重共线性的情况下,可能遇到如下一个或多个后果:
。从而OLS估计量的精确度下降。