文档介绍:单位代码
学号 SY1401138
分类号
密级
应用数理统计(第一个论文)
山东省旅游发展影响因素多元回归分析
院(系)名称材料科学与工程学院
专业名称材料科学与工程
学生姓名李新杰
任课教师冯伟
2014年12月
摘要
本文主要通过对山东省旅游收入的多因素分析,建立以山东省旅游总收入为因变量,以国内旅游人数、接待入境人数、旅行社总数、旅游饭店数量以及旅游社职工人数等为自变量的多元线性回归模型,并利用SPSS统计软件建立逐步回归模型,找到影响山东省旅游业发展的显著性变量,并对所得的模型给予合理的经济解释。
关键词:逐步回归法山东省旅游发展 SPSS 相关性显著性主成分
目录
摘要 1
1 引言 1
2 数据收集 2
3统计数据的初步分析 3
变量间的相关性分析 3
3
4 回归分析 5
回归模型的建立 5
回归模型参数的估计 6
6
7
7
5 回归模型的验证与修正 8
方差分析 8
回归方程的拟合度检验 8
残差检验 9
11
回归模型的修正 11
6 结果 13
参考文献 14
山东省旅游发展影响因素多元回归分析
学号:SY1401138
姓名:李新杰
1 引言
随着社会经济快速发展,生活节奏加快,人们的压力变得越来越大,为减轻压力,既能放松自己,又能拓展自我视野的旅游就成为了人们的首要选择。从我国近 5 年的统计数据来看,我国每年的旅游收入正在逐年递增,旅游消费已成为中国人们日常支出中的重要部分。山东省地处黄海之滨和黄河入海口,有着秀丽的自然风光,众多的人文景观,旅游资源十分丰富。全省拥有旅游景区、景点509处,其中泰山和曲阜“三孔”列入世界遗产名录,青岛烟台、威海代表了中国海滨旅游的一大片。全省旅游资源品位高,种类全,分布广,综合条件好,旅游业发展和旅游总收入位于全国前列,为了更好地了解山东省旅游业的发展,对山东省旅游业发展的影响因素建立回归模型分析,找出其核心影响因素。
在应用回归分析去处理实际问题时,必须通过合理经济的方法建立最优回归方程。建立最优回归方程时要注意两个方面:(1)方程中要包含所有的显著作用的自变量,不能遗漏;(2)希望变量个数尽可能少,不含有无意义的变量,而且还应该使这类方程的S达到最小。目前最常用的是逐步回归分析方法,即利用自变量和因变量的一系列同步观测数据,通过对相关矩阵的变换和数理统计的假设检验,逐步把显著性的自变量选入回归方程中,同时也把非显著性的自变量从回归方程中剔除,最终建立一个最优回归方程。
2 数据收集
表2-1 2000-2013年山东省旅游总收入、国内旅游人数、入境旅游人数、旅游社总数、旅游饭店总数、旅行社职工人数
注:以上数据根据《山东省统计年鉴2000-2013年》整理所得
3统计数据的初步分析
变量间的相关性分析
为了知道旅游总收入具体和哪些变量有较大的关系,并将这些变量加入到线性模型中,首先要对旅游总收入和5个变量进行相关性分析,得到各个数据之间的相关系数表:
表3-1 各个变量之间的相关系数表
从表3-1可以看出旅游总收入Y和其他变量之间的相关系数,其中旅游总收入(亿元)和X1:国内旅游人数(万人次)的线性正相关程度最高,其次是X2:入境旅游人数(万人次),而旅行社职工人数等相关程度相对较小,所以需要对变量进行一元线性模型验证,以确定是否需要排除掉变量。
以上我们通过相关性分析确定了各相应变量对旅游总收入Y的影响,为了确定是否需要将所有的变量都加入到线性模型中,下面将通过做出旅游总收入
Y分别和其他5个变量的散点图来进行验证:
(a) (b)
(c) (d)
(e)
图3-1 因变量和自变量间的散点图:
(a)为旅游总收入Y和国内旅游人数的散点图,(b)为旅游总收入Y和入境旅游人数的散点图,(c)为旅游总收入Y和旅行社总数的散点图,(d)为旅游总收入Y和旅游饭店总数的散点图,(e)为旅游总收入Y和旅行社职工人数的散点图
从图3-1中的因变量旅游总收入和5个自变量的散点图来看,旅游总收入和5个自变量都有很好的线性关系,这说明通过相关性分析得到的这5个和旅游总收入有关系的自变量都是正确的,而旅游社总数、饭店总数、旅行社职工人数与旅游总收入的相关性差不多,故无需对数据进行删除,因此在接下来进行多元逐步回归分析的时候会将这5个变量都加入到多元线性模型中进行模型建立和分析。
4 回归分析
回归模型的建立