文档介绍:应用普通最小二乘法时要求模型的随机误差项必须满足:
〔1〕无偏性假定。即所有随机误差项的期望为0
〔2〕同方差性假定。即所有随机误差项的方差相等
〔3〕无序列相关性假定。即随机误差项之间无序列相关性
〔4〕解释变量与随机误差项相互独立。即解释变量为非随机变量
〔5〕正态性假定。即随机误差项服从均值为0的正态分布。
在此根底上估计的参数才是最优线性无偏估计量。
但在实际操作处理过程中,这些根本的假定条件不一定满足,这使得模型无法应用OLS方法估计或运用OLS方法得到的估计量不具备最优线性无偏的特点。因此在建立模型后,需要检验随机误差项是否符合OLS的假设条件。如果不符合,那么需要对估计方法进展改进和修改。
线性回归的常见问题
多重共线性
异方差性
自相关性
多重共线性
i=1,2,…,n
其根本假设之一是解释变量之间不存在完全共线性。
如果某两个或多个解释变量之间出现了相关性,那么称为多重共线性(Multicollinearity)。
如果存在
c1X1i+c2X2i+…+ckXki=0 i =1,2,…,n
其中: ci 不全为0,那么称为解释变量间存在完全共线性。
多重共线性在实际的多元线性回归分析尤其是涉及经济变里的模型中很常见。即在决定一个因变量的多个自变量中,有局部自变量呈高度相关,也就是说,这些变量被用来解释因变量时导致所提供的信息出现“重叠〞。例如、模型中如果有多个自变量有共同的上升趋势,它们之间很可能有高度的相关关系导致共线性。
实际经济问题中的多重共线性
〔1〕经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各根本经济变量〔收入、消费、投资、价格〕都趋于增长;衰退时期,又同时趋于下降。
横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。
〔2〕滞后变量的引入
在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。
例如,消费=f(当期收入, 前期收入〕
显然,两期收入间有较强的线性相关性。
〔3〕样本资料的限制
由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性
一般经历:
诊断方法
条件指数〔condition index〕可以用来判断多重共线性是否存在
以及多重共线性的严重程度,通常认为:
从条件指数可以看到,最大的条件数为,说明自变量间存在严重的共线性。
如果有某几个自变量的方差比例值在某一行同时较大〔接近1〕,那么这几个自变量间就存在共线性。
根据例计算特征值及条件指数
多重共线性检验SPSS
翻开[Linear Regression: Statistics]子对话框,选择[Collinearity diagnostics(共线性诊断)],单击[Continue]返回主对话框并单击[OK]按钮。这样SPSS 便可输出所有检查多重共线性的指标。