文档介绍：【摘要】国家的财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关。首先,我们根据所给数据,对数据进行描述性分析。之后,我们对数据进行了回归分析,构造了预测模型,获得了模型的回归系数估计值,然后,考虑到每个回归系数置信区间包含零点与否的情况,我们对模型进行了一系列的统计检验,并对模型进行了消除序列相关性的改进,使模型通过了各个统计的检验。之后,我们代入所给数据1953年-1980年的各项经济指标,得到预测值与实际值的拟合效果较好,预测较准确。最后,我们根据网络上查到的数据,利用该模型对1990年和2000年的财政收入作出预测,并对结果进行了分析。关键词:MATLABEviews财政收入回归模型LM检验序列相关性问题重述国家的财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关,根据所给数据,对数据进行分析,构造预测模型,并利用该模型对1990年和2000年的财政收入作出预测。问题假设财政收入只可能与问题重述中提到的6个因素有关,而与其它因素无关;所给数据真实准确,无录入错误。不考虑偏差大的数据,在建模中把异常点的数据剔除。三、符号说明y:财政收入;x1:国民收入;x2:工业总产值;x3:农业总产值;x4:总人口;x5:就业人口;x6:固定资产投资;β0,β1,β2,β3,β4,β5,β6:回归系数;E:随机误差。X1(-1),X3(-1),X6(-1):x1,x3,x6的一阶滞后项;YF:财政收入的预测值四、问题分析、。分别用MATLAB作出财政收入与6个因素的散点图,从中找出异常的点,从而把异常的点所对应的数据剔除:图1x1-y散点图图2x2-y散点图图3x3-y散点图图4x4-y散点图图5x5-y散点图由该图可以明显看出,最右边有一个异常点:1981年就业人口攀升为73280,较之前有大幅度增长,但财政收入明显地低于预测值,为使个别数据不致影响整个模型,我们将该异常数据去掉。去掉后的x5-y散点图如下:图6去掉异常点后的x5-y散点图图7x6-~x6大致都呈现线性的关系,我们再引入一个常量回归系数β0,作出了初步的模型:y=β0+β1x1+β2x2+β3x3+β4x4+β5x5+β6x6+E(1)(见图6),之后利用MATLAB统计工具箱中命令regress求解,得到模型(1)的回归系数估计值及其置信区间(置信水平α=)、检验统计量R2,F,p的结果见表1。参数参数估计值参数置信区间β0-----------=,F=,p=(1)的计算结果表1显示,R2=(财政收入)%可由模型(1)的自变量的变化来解释,F值远远超过F检验的临界值,p=0远小于α,因而模型(1)从整体来看是可用的。表1的回归系数给出了模型(1)中β0,β1,β2,β3,β4,β5,β6的估计值,即,,,,,,。检查它们的置信区间发现,β0,β2,β4,β5,β6的置信区间包含零点。从估计结果来看,模型可能存在多重共线性。原因如下:在5%的显著性水平下,由置信区间可以看出除x1与x3外,所有回归系数的t检验值均小于临界值;,且拟合优度很高,解释变量对被解释变量有显著的解释性能力。应用Eviews软件,采用菜单操作可得各解释变量之间的相关系数表,结果见表2:表2从上图可以看出六个解释变量之间两两简单相关关系都在80%以上,甚至有的在98%以上,超过了拟合优度,这表明模型存在严重的多重共线性。,我们采用逐步回归法来确定回归模型。第一步,用每个解释变量分别对被解释变量做简单回归,从而决定解释变量的重要程度,为解释变量排序。应用Eviews软件,采用菜单操作可得各解释变量与被解释变量的拟合优度:x1的拟合优度R2==、x3的拟合优度R2=、X4的拟合优度R2=、x5的拟合优度R2==,可见解释变量的重要程度依次为:x1,x6,x