文档介绍:第三章多元线性回归分析
在上一章中,讨论了一元线性回归模型。
现实经济现象是错综复杂的,多种经济变量互相影响,每一个变量都要受到其他多种因素的影响,表现在线性回归模型中为解释变量有多个。这样的模型被称为多元线性回归模型。
例如,对人均国民生产总值的影响问题,除了人口变动因素之外,固定资产数额、货币供给量、物价指数、国内国际市场供求关系等多种因素都会影响人均国民生产总值。
多元线性回归模型参数估计的原理与一元线性回归模型相同,只是计算更为复杂。
§ 模型的假定
多元线性回归模型通常要满足六个假设条件:
假设1 E(ui)=0, i=1,2, …,n
假设2 Var(ui)= E(ui2) = u2
假设3 Cov(ui, uj) = E(ui uj)=0 i≠j,i,j =1,2, …,n
假设4 Cov(xji, ui)=0,i=1,2, …,n,j=2,3, …,k
假设5 ui~N(0, u2 )
假设6 任何解释变量之间不存在严格的线性相关,
即不存在多重共线性。
多元线性回归模型的一般形式为
与多元线性总体模型式相应的总体回归方程为
样本回归模型为
样本回归方程为
为了使多元线性回归分析和计算更方便、更简洁,引入矩阵这一数学工具,它在计量经济学理论与应用中都是不可缺少的。
则总体回归模型的n个随机方程的矩阵表达式为Y=X B + U
则总体回归方程为: E(Y)=X B
样本回归模型为:
样本回归方程为:
相应地,经典假设可以表示为
假设1 E(U)=0
假设2 和假设3 Cov (U) = u2 I (其中: I为n阶单位矩阵)
假设4 可以表示为矩阵X的所有元素均为非随机元素。即X为确定的矩阵。
E(X'U) = 0
假设5 可以表示为矩阵U服从多元正态分布,即
U~N(0, u2 I)
这种表示方式包括了假设1,2,3和5。
假设6 可以表示为 R(X)=k< n
即X列满秩,列秩为k,即系数行列式X'X≠0
这个条件是得到参数估计矩阵的充分必要条件。
k< n,相当于要求样本容量n足够大。
因为自由度(n-k)与误差项的方差估计值S2有关。若(n-k)太小, S2就比较大, 不容易通过显著性检验。
实际上,样本容量最好能够满足n远大于k。如果由于客观条件限制,样本容量n不能太大,那么解释变量数目k就不是越多越好。
同时B的置信区间、总体Y0和E(Y0)的置信区间过大,将失去预测的意义。
由样本回归模型:
及样本回归方程:
得残差矩阵为:
总体回归模型: Y=X B + U 中参数矩阵中的各元素1 ,2,…, k,反映了解释变量X2 ,X3,…, Xk 对被解释变量 Y 的影响程度。
在多元线性回归分析中,仍然根据最小二乘原理,利用有限样本对矩阵B进行估计,得出参数估计值矩阵。即,
§ 参数的最小二乘估计
达到最小值。
使残差平方和
2
i
e
å
根据假设6,有XX≠0,即矩阵XX为非奇异矩阵,则(XX)-1存在,因此,参数的最小二乘估计值为:
考虑到上式右边每一项均为标量,即1×1矩阵,则
残差矩阵平方和为:
※