文档介绍:《应用回归分析》考查论文
题目
姓名
班级
学号
教师评语
论文成绩
任课教师签名
关于影响GDP的回归分析
摘要:GDP是体现国民经济增长状况和人民群众客观生活质量的重要指标。为了研究影响GDP的潜在因素,通过收集到的样本数据运用课本学过的回归分析知识,建立与GDP有影响的自变量与因变量间的多元线性回归模型,借助统计软件SPSS对样本作初等模型,同时结合统计专业知识对初等模型作F检验、回归系数检验、异方差性检验、假设检验等,确立最终的经验回归方程,回归方程对样本的是拟合度最好的。最后通过对做出来的模型分析得出GDP的主要影响因素,对提高GDP具有一定得现实意义。
引言:在当今欧美主导的经济发展理论下,衡量一个国家的综合实力看的不仅是国家的军事实力、国家影响力,而更看重国家的经济实力,而GDP代表一国或一个地区所有常住单位和个人在一定时期内全部生产活动的最终成果,是当期新创造财富的价值总量,它是一个国家经济实力的最好体现,具有国际可比性,是联合国国民经济核算体系(SNA)中最重要的总量指标,为世界各国广泛使用并用于国际比较。众所周知2008年我国GDP跃居世界第三位,是仅次于美国、日本的第三大经济国,而2009年在金融危机的影响下我国GDP稳中求进,%的增长态势。提高GDP已经成为经济发展的潮流,利用国家的各种有限资源,在最大程度上发挥资源的利用率,推动经济的发展是势在必行的,因为资源一直在减少,而人口一直在增加,要保持经济的增长就必要抓住主要因素,提高GDP。
一、多元线性回归模型的基本理论
首先是对线性回归模型基本知识介绍:随机变量y与一般变量x1,x2,x3...xp的理论线性回归模型为:
其中,,..., 是P+1个未知参数,称为回归常数,,...,称为回归系数。y称为被解释变量(因变量),而x1,x2,...,xp是P个可以精确测量并可控制的一般变量,称为解释变量(自变量)。是随机误差,在多元线性回归模型中有五个基本假设:
假设一:随机误差项0均值假定;
假设二:随机误差项同方差;
假设三:随机误差项不相关
假设四:随机误差项服从如下正态分布
;
只有求得的经验回归方程通过了回归分析中各检验并满足上述四个假设时,我们才可以明确此时的经验回归方程对我们的样本数据拟合得好,可以用此时的回归模型作控制与预测了。
二、回归模型初步建立与检验
收集的数据由于存在单位上的差异,且数据量很大,故可能存在误差、量纲的影响。首先将数据标准化,再对样本作模型假设,可得出y对6个自变量的线性回归方程为:
y=*E-15+++++--
应用F检验对回归方程进行显著检验,检验统计量为:F=SSR/SSE,SSR为回归回归平方和,SSE为残差平方和,从上表中的结果可以看出显著性p值,由于p近似为0,:p﹤,可知其回归方程高度显著。
三、回归方程系数检验
但回归方程显著并不表示每个自变量对y的影响都显著,因此我们队方程的回归系数作显著性检验。如果某个自变量对y的作用不显著,那么在模型中相应的系数值就为0。提出假设检验:H0:βj=0,j=1,2…p 若接受原假设,则自变量不显著;若拒绝原假设,那么相应的自变量是显著的。
参考表(1),虽然该方程F检验回归方程是显著的,,某些单个自变量对y并不显著。
从上表中可以看出,y与x1、x2、x5的相关系数较大,说明自变量与y高度相关。其他几个变量对y的贡献不是很大,故需剔除一些变量。
四、检验异方差性及自相关
从表(4)中我们可以知道DW值=,,误差项之间存在正自相关。我们再根据DW分布表,查得临界值dl=,du=,,DW=<,故可知误差项之间存在正相关。
从输出结果表(5)看到,自变量的方差扩大因子不是很大。但有几个变量的方差因子大于10,故变量间可能存在共线性的关系。我们进一笔采用后退法来剔除共线性变量及自相关的变量。
五、自变量的选择与模型最终建立
表(6)
表(8)
从表(5)中我们知道,复决定系数R2=,R2a=,而全模型的复决定系数R2=,R2a=。而由表(7)可知,最优子集的回归方程为:
y=--16++。
六、最终方程的检验及假设检验
从上表可以知道,显著性p近似值为0,说明回归方程高度显著。亦可从表(7)中得到扩大方程因子全都小于10,p值近似为0,也可