文档介绍:第三章双变量线性回归模型
(简单线性回归模型)
(Simple Linear Regression Model)
第一节双变量线性回归模型的估计
一. 双变量线性回归模型的概念
设 Y = 消费, X = 收入, 我们根据数据画出散点图
Y * 这意味着
* Y = + X (1)
* 我们写出计量经济模型
* Y = + X + u (2)
* 其中 u = 扰动项或误差项
Y为因变量或被解释变量图1 X X为自变量或解释变量
和为未知参数
设我们有Y和X的n对观测值数据,则根据(2)式,变量Y的每个观测值应由下式决定:
Yi = + Xi + ui , i = 1, 2, ...,n (3)
(3)式称为双变量线性回归模型或简单线性回归模型。其中和为未知的总体参数,也称为回归模型的系数( coefficients)。下标 i是观测值的序号。
当数据为时间序列时,往往用下标 t来表示观测值的序号,从而(3)式变成
Yt = + Xt + ut , t = 1, 2, ...,n (3’)
为何要在模型中包括扰动项u
我们在上一章中已初步介绍了为什么要在模型中包括扰动项u,下面进一步说明之:
(1)真正的关系是Y = f (X1, X2,…),但X2, X3,…, 相对不重要,用u代表之。
(2)两变量之间的关系可能不是严格线性的,u反映了与直线的偏差。
(3)经济行为是随机的,我们能够用 Y=α+βX
解释“典型”的行为,而用u来表示个体偏差。
(4)总会出现测量误差, 使得任何精确的关系不可能存在。
二. 普通最小二乘法(OLS法, Ordinary Least squares)
我们的模型是:
Yt = + Xt + ut , t = 1, 2, ...,n
这里和为未知总体参数,下一步的任务是应用统计学的方法,由Y和X的观测值(即样本数据)来估计和的总体值,常用的估计方法就是最小二乘法。为了应用最小二乘法,得到好的估计量,双变量线性回归模型需要满足一些统计假设条件,这些统计假设是:
双变量线性回归模型的统计假设
(1). E(ut) = 0, t= 1, 2, ...,n
即各期扰动项的均值(期望值)为0.
(2). E(uiuj) = 0 i j
即各期扰动项互不相关.
(3). E(ut2 ) = 2 , t= 1, 2, ...,n
即各期扰动项方差是一常数.
(4). 解释变量Xt 为非随机量
即Xt的取值是确定的, 而不是随机的.
(5). ut ~ N( 0, 2 ) , t= 1, 2, ...,n
即各期扰动项服从正态分布。
下面简单讨论一下上述假设条件。
(1)E(ut) = 0, t=1,2,…,n
即各期扰动项的均值(期望值)均为0。
均值为0的假设反映了这样一个事实:扰动项被假定为对因变量的那些不能列为模型主要部分的微小影响。没有理由相信这样一些影响会以一种系统的方式使因变量增加或减小。因此扰动项均值为0的假设是合理的。
(2)E(uiuj) = 0, i≠j
即各期扰动项互不相关。也就是假定它们之间无自相关或无序列相关。
实际上该假设等同于:
cov( uI, uj) = 0, i≠j
这是因为:cov(uI, uj) = E{[ui - E(ui)][uj - E(uj)]}
= E(uiuj) ——根据假设(1)
(3)E(ut2)= 2, t=1,2,…,n
即各期扰动项的方差是一常数,也就是假定各扰动项具有同方差性。
实际上该假设等同于:
Var( ut) = 0, i≠j
这是因为:
Var(ut)=E{[ut-E(ut)]2}= E(ut2) ——根据假设(1))
(4) Xt为非随机量
即Xt的取值是确定的, 而不是随机的。
有的书上采用弱一些的条件:
E(Xtut) = 0, t=1,2,…,n
即解释变量X与扰动项u不相关。
(5)ut ~ N( 0, 2 ) , t= 1, 2, ...,n
即扰动项服从正态分布。
满足条件(1)—(4)的线性回归模型称为古典线性回归模型(CLR模型)。