文档介绍:经济数据特点与类型。
1、横截面数据:各种经济个体变量在同一时间点上取值,如中华人民共和国各省GDP
2、时间数列数据:指是某个经济个体变量在不同步点上取值,如1978-山东省每年GDP
3、面板数据:各种经济个体变量在不同步点上取值,如1978-中华人民共和国各省GDP
小样本OLS(最小二乘法):单一方程线性回归最常用办法
条件:解释变量与扰动项正交、扰动项无自有关、同方差。
拟合优度:衡量线性回归模型对样本数据拟合限度(R2),越高阐明模型拟合限度越好。
单系数T检查:对回归方程扰动项详细概率进行假设
明显性水平进行检查
F检查:整个回归方程与否明显
STATA操作简介:
如果数据中包括1949-10-01或1949/10/01时间变量,导入stata后也许会被视为字符串,因而对于日度数据,可以使用命令gen newvar=date(varname,YMD),将其转换为整数日期变量,其中YMD阐明原始数据格式为年月日,如果原始数据格式为月日年则使用MDY;对于月度数据则gen newvar=monthly(varname,YM)。
.describe:数据概貌 .drop keep:删除和保存
.su:记录特性 Pwcorr:变量之间有关系数
Star(.05):5%明显性水平 gen:产生
g intc=log(tc):取自然对数. reg:OLS回归
.Vce:协方差矩阵 reg。。。,noc表达在进行回归时不要常数项
大样本OLS:只规定解释变量与同期扰动项正交即可
Robust:稳健原则误,如果存在异方差,则应使用稳健原则误
最大似然预计法:如果回归方程存在非线性,则使用最大似然预计法(MLE)或非线性最小二乘法(NLS)
三类在大样本下渐进等价记录检查:Wald test LR(似然比检查) LM
操作环节如下:sysuse auto(调用数据集)
Hist mpg,normal(画变量mpg直方图,并与正态密度比较)
直方图显示,变量mpg分布于正态分布有一定差距。
变量可以取对数解决非正态分布问题。
异方差与GLS(广义最小二乘法)
异方差检查:看残差图、怀特检查(white test)、BP检查(Breusch and Pagan)
异方差解决:1、OLS+稳健原则误(最佳)
2、广义最小二乘法(GLS)
3、加权最小二乘法(WLS)
实例操作:
使用数据:use ,clear
reg intc inq inpl inpk inpf(进行回归)
画残差图:rvfplot
上图可以发现当拟合值较小时,扰动项方差较大,继续考察残差与解释变量inq散点图:rvpplot inq,成果与上图几乎一致,也许存在异方差,即扰动项方差随着观测值而变。
完毕回归后,进行怀特检查:estat imtest,white
P值明显,以为存在异方差
6、完毕回归后,进行BP检查:estat hettest,iid estat hottest,rhs iid estat hottest inq,iid
三种形式检查都强烈回绝同方差原假设,存在异方差(这里只放一种形式检查成果)
解决异方差
自有关 :扰动项之间自有关
自有关例子:1、时间序列数据中普通具备某种持续性和持久性,如相邻两年GDP增长率;2、截面数据中相邻观测单位之间也许存在溢出效应,如相邻地区农业产量收到类似天气变化影响;3、对数据人为解决如数据中包括移动平均数等;4、如果模型设定中漏掉了某个自有关解释变量并被纳入到扰动项中,则会引起扰动项自有关。
自有关检查:1、画图(不推荐)2、BG检查estat bgodfrey 3、BOX-Pierce Q检查 4、DW检查 estat dwatson. 检查都要在OLS做完后才干做。
自有关解决:1、使用OLS+异方差自有关稳健原则误;2、OLS+聚类稳健原则误;3、使用可行广义最小二乘法(FGLS);4、修改模型设定
自有关解决实例:1、使用数据 icecream 然后进行回归
BG检查
明显 回绝了原假设无自有关,则以为存在自有关
Q检查(略)、DW检查如下
DW= 距离2很远 可以以为存在自有关。
由以上检查可以看出扰动项之间存在自有关,因而OLS提供原则误是不精确,应使用异方差自有关稳健原则误,由于样本为3