文档介绍:[经验分享]使用eviews做线性回归分析
Glossary:
ls(leastsquares)最小二乘法
R-sequared样本决定系数(R2):值为0-1,越接近1表示拟合越好,>,但是R2随因变量的增多而增大设,即认为各个因素的影响强弱发生了改变。
问题是如何才能准确的找到这个或这几个断点?目前的方法是找残差扩大超出边线的那个点,但这是不准
确的,在demo中1975Q2的残差超出,但是chow',,并且有逐渐减小之势。
chow'sforecast检验用断点隔断样本,用之前的样本建立回归模型,然后用这个模型对后一段进行预测,检验这个模型对后续样本的拟合程度。
0假设是:模型与后段样本无显著差异
demo中的1976Q4作为breakpoint,得到两个p值为0,即认为两段样本的系数应该是不同的。
自变量的选择
testadd检验:
操作方法是:...
0假设:应该将该变量引入方程
检验统计量:wald,LR
结果:通过两个p值(,ProbChi-sequare)看是否拒绝原假设
testdrop检验:
操作方法是:...
0假设:应该将该变量剔除
检验统计量:wald,LR
结果:通过两个p值(,ProbChi-sequare)看是否拒绝原假设
含定性变量的回归模型分为:自变量含定性变量,因变量含定性变量。后一种情况较为复杂
建立dummy变量(名义变量):用D表示
当变量有m种情况时,需要引入m-1个dummy变量
处理办法:
常见问题及对策
1)多重共线性(multicollinearity):
p个回归变量之间存在严格或近似的线性关系
诊断方法:
如果模型的R-sequared很大,F检验通过,但是某些系统的t检验没通过
某些自变量系数之间的简单相关系数很大
回归系数符号与简单相关系统符号相反以上3条发生都有理由怀疑存在多重共线性
方差扩大因子(varianceinflationfactorVIFj)是诊断多重共线性的常用手段。
VIFj为矩阵(X'X)-1第j个对角元素cjj=1/(1-R2j)(j=1,2:p)
其中R2j为以作为cj因变量,其余p-1个自变量作为自变量建立多元回归模型所得的样本决定系数,所以
R2j越大则说明自变量之间自相关性越大,此时也越大,可以认为VIFj>10(R2j>。
还可以使用VIFj的平均数作为判断标准,如果avg(VIFj)远大于10则认为存在多重共线性。
eviews里如何使用VIF法?--建立方程,然后手工建立scalarvif。demo中GDP和PR的vif为66,存在多重
共线性?只有一个自变量的方程是否会失效?,说明GDP远远不是PR能决定的。结合testdrop将PR去除,两个p值为0,说明不能把PR去除。
在eviews中当自变量存在严重的多重共线性时将不能给出参数估计值