文档介绍:第五章模型的建立与估计中的问题及对策
我们已学到了许多有用的计量经济分析方法,如建立模型、估计参数、假设检验、预测、非线性模型的线性化,用虚拟变量将定性因素引入模型等。
可是,我们所使用的最小二乘法,以及由此而得到的OLS估计量令人满意的性质,是根据一组假设条件而得到的。在实践中,如果某些假设条件不能满足,则OLS就不再适用于模型的估计。在这种情况下,分析方法就需要改变。下面列出实践中可能碰到的一些常见问题:
l 误设定(Misspecification 或specification error)
l 多重共线性(Multicollinearity)
l 异方差性(Heteroscedasticity)
l 自相关(Autocorrelation)
本章将对上述问题作简要讨论,主要介绍问题的后果、检测方法和解决途径。
第一节误设定
采用OLS法估计模型时,实际上有一个隐含的假设,即模型是正确设定的。这包括两方面的含义:函数形式正确和解释变量选择正确。在实践中,这样一个假设或许从来也不现实。我们可能犯下列三个方面的错误:
选择错误的函数形式
遗漏有关的解释变量
包括无关的解释变量
从而造成所谓的“误设定”问题。
一. 选择错误的函数形式
这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的。因此,我们应当根据实际问题,选择正确的函数形式。
我们在前面各章的介绍中采用的函数形式以线性函数为主,上一章介绍了应变量和解释变量都采用对数的双对数模型,下面再介绍几种比较常见的函数形式的模型,为读者的回归实践多提供几种选择方案。这几种模型是:
半对数模型
双曲函数模型
多项式回归模型
1. 半对数模型
半对数模型指的是应变量和解释变量中一个为对数形式而另一个为线性的模型。应变量为对数形式的称为对数-线性模型(log-lin model)。解释变量为对数形式的称为线性-对数模型(lin-log model)。我们先介绍前者,其形式如下:
对数-线性模型中,斜率的含义是Y的百分比变动,即解释变量X变动一个单位引起的应变量Y的百分比变动。这是因为,利用微分可以得出:
这表明,斜率度量的是解释变量X的单位变动所引起的应变量Y的相对变动。将此相对变动乘以100,就得到Y的百分比变动,或者说得到Y的增长率。由于对数-线性模型中斜率系数的这一含义,因而也叫增长模型(growth model)。增长模型通常用于测度所关心的经济变量(如GDP)的增长率。例如,我们可以通过估计下面的半对数模型
得到一国GDP的年增长率的估计值,这里t为时间趋势变量。
线性-对数模型的形式如下:
与前面类似,我们可用微分得到
因此
这表明
上式表明,Y的绝对变动量等于乘以X的相对变动量。因此, 线性-对数模型通常用于研究解释变量每变动1%引起的因变量的绝对变动量是多少这类问题。
2. 双曲函数模型
双曲函数模型的形式为:
不难看出,这是一个仅存在变量非线性的模型,很容易用重新定义的方法将其线性化。
双曲函数模型的特点是,当X趋向无穷时,Y趋向,反映到图上,就是当X趋向无穷时,Y将无限靠近其渐近线(Y= )。
双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯曲线。
3. 多项式回归模型
多项式回归模型通常用于描述生产成本函数,其一般形式为:
其中Y表示总成本,X表示产出,P为多项式的阶数,一般不超过四阶。
多项式回归模型中,解释变量X以不同幂次出现在方程的右端。这类模型也仅存在变量非线性,因而很容易线性化,可用OLS法估计模型。
二. 遗漏有关的解释变量
模型中遗漏了对因变量有显著影响的解释变量的后果是:将使模型参数估计量不再是无偏估计量。
三. 包括无关的解释变量
模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。
[注] 有关上述两点结论的说明请参见教科书P101-102。