文档介绍:该【应用回归分析课后题答案 】是由【1485173816】上传分享,文档一共【50】页,该文档可以免费在线阅读,需要了解更多关于【应用回归分析课后题答案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。第1页
?应用回归分析?局部课后习题答案
第一章回归分析概述
?
答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量确实定关系。
?
答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量x和变量y处于平等的地位,即研究变量y及变量x的密切程度及研究变量x及变量y的密切程度是一回事。。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机确实定变量。。而回归分析不仅可以提醒变量x对变量y的影响大小,还可以由回归方程进展预测和控制。
?
答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y及x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
?
答:线性回归模型的根本假设有:….xp是非随机的,…..xip是常数。{E(εi)=0i=1,2….Cov(εi,εj)={σ^2
。,即n>p.
?在回归变量设置时应注意哪些问题?
答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。应注意的问题有:在选择变量时要注意及一些专门领域的专家合作,不要认为一个回归模型所涉及的变量越多越好,回归变量确实定工作并不能一次完成,需要反复试算,最终找出最适宜的一些变量。
,整理数据包括哪些内容?
答;常用的样本数据分为时间序列数据和横截面数据,因而数据收集的方法主要有按时间顺序统计数据和在同一时间截面上统计数据,在数据的收集中,样本容量的多少一般要及设置的解释变量数目相配套。而数据的整理不仅要把一些变量数据进展折算差分甚至把数据对数化,标准化等有时还需注意剔除个别特别大或特别小的“野值〞。
?
答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量及被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进展计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。
?
答:我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正提醒了被解释变量和解释变量之间的关系。
?
答:回归模型的应用方面主要有:经济变量的因素分析和进展经济预测。
?
答:在回归模型的运用中,我们还强调定性分析和定量分析相结合。这是因为数理统计方法只是从事物外在的数量外表上去研究问题,不涉及事物质的规定性,单纯的外表上的数量关系是否反映事物的本质?这本质终究如何?必须依靠专门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及现实情况严密结合,这样才能保证回归模型在经济问题研究中的正确应用。
第1页
第二章一元线性回归
:〔1〕散点图为:
〔2〕x及y之间大致呈线性关系。
〔3〕设回归方程为
〔4〕
〔5〕由于
服从自由度为n-2的t分布。因而
也即:=
可得
即为:〔,〕
服从自由度为n-2的t分布。因而
即
可得
〔6〕x及y的决定系数
〔7〕
ANOVA
x
平方和
df
均方
F
显著性
组间
〔组合〕
2
.100
线性项
加权的
1
.056
偏差
.833
1
.833
.326
组内
2
.500
总数
4
由于,拒绝,说明回归方程显著,x及y有显著的线性关系。
第2页
〔8〕其中
承受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。
〔9〕相关系数
小于表中的相应值同时大于表中的相应值,x及y有显著的线性关系.
(10)
序号
1
1
10
6
4
2
2
10
13
-3
3
3
20
20
0
4
4
20
27
-7
5
5
40
34
6
残差图为:
从图上看,残差是围绕e=0随机波动,从而模型的根本假定是满足的。
〔11〕当广告费=,销售收入
,即〔,〕
:
〔1〕散点图为:
第3页
〔2〕x及y之间大致呈线性关系。
〔3〕设回归方程为
(4)
=
(5)由于
服从自由度为n-2的t分布。因而
也即:=
可得
即为:〔,〕
服从自由度为n-2的t分布。因而
即
第4页
可得
(6)x及y的决定系数=
(7)
ANOVA
x
平方和
df
均方
F
显著性
组间
〔组合〕
7
.168
线性项
加权的
1
.027
偏差
6
.315
.885
组内
2
总数
9
由于,拒绝,说明回归方程显著,x及y有显著的线性关系。
(8)其中
承受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。
(9)相关系数
小于表中的相应值同时大于表中的相应值,x及y有显著的线性关系.
(10)
序号
1
825
2
215
1
3
1070
4
4
550
2
-
5
480
1
-
6
920
3
-
7
1350
-
8
325
9
670
3
10
1215
5
第5页
从图上看,残差是围绕e=0随机波动,从而模型的根本假定是满足的。
(11)
〔12〕,
即为〔,〕
近似置信区间为:,即〔,〕
〔13〕可得置信水平为为,即为〔,〕.
(1)散点图为:
可以用直线回归描述y及x之间的关系.
(2)回归方程为:
(3)
从图上可看出,检验误差项服从正态分布。
第三章多元线性回归
:〔1〕用SPSS算出y,x1,x2,x3相关系数矩阵:
相关性
y
x1
x2
x3
Pearson相关性
y
.556
.731
.724
x1
.556
.113
.398
x2
.731
.113
.547
x3
.724
.398
.547
y
.
.048
.008
.009
第7页
相关性
y
x1
x2
x3
Pearson相关性
y
.556
.731
.724
x1
.556
.113
.398
x2
.731
.113
.547
x3
.724
.398
.547
y
.
.048
.008
.009
x1
.048
.
.378
.127
x2
.008
.378
.
.051
x3
.009
.127
.051
.
N
y
10
10
10
10
x1
10
10
10
10
x2
10
10
10
10
x1
.048
.
.378
.127
x2
.008
.378
.
.051
x3
.009
.127
.051
.
N
y
10
10
10
10
x1
10
10
10
10
x2
10
10
10
10
x3
10
10
10
10
所以=
系数a
模型
非标准化系数
标准系数
t
Sig.
%置信区间
相关性
共线性统计量
B
标准误差
试用版
下限
上限
零阶
偏
局部
容差
VIF
1
(常量)
-
-
.096
-
x1
.385
.100
-.977
.556
.621
.350
.825
x2
.535
.049
.053
.731
.709
.444
.687
x3
.277
.284
-
.724
.433
.212
.586
:y
(2)
所以三元线性回归方程为
模型汇总
模型
R
R方
调整R方
标准估计的误差
更改统计量
R方更改
F更改
df1
df2
1
.898a
.806
.708
.806
3
6
.015
:(常量),x3,x1,x2。
〔3〕
由于决定系数R方==
〔4〕
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3
.015a
残差
6
总计
9
:(常量),x3,x1,x2。
第7页
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3
.015a
残差
6
总计
9
:(常量),x3,x1,x2。
:y
因为F==<
〔5〕
系数a
模型
非标准化系数
标准系数
t
Sig.
%置信区间
相关性
共线性统计量
B
标准误差
试用版
下限
上限
零阶
偏
局部
容差
VIF
1
(常量)
-
-
.096
-
x1
.385
.100
-.977
.556
.621
.350
.825
x2
.535
.049
.053
.731
.709
.444
.687
x3
.277
.284
-
.724
.433
.212
.586
:y
〔6〕,所以x3的回归系数没有通过显著检验,应去除。
去除x3后作F检验,得:
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
2
.007a
残差
7
总计
9
:(常量),x2,x1。
:y
由表知通过F检验
继续做回归系数检验
系数a
模型
非标准化系数
标准系数
t
Sig.
%置信区间
相关性
共线性统计量
B
标准误差
试用版
下限
上限
零阶
偏
局部
容差
VIF
1
(常量)
-
-
.020
-
-
x1
.479
.037
.381
.556
.697
.476
.987
x2
.676
.008
.731
.808
.672
.987
:y
此时,我们发现x1,x2的显著性大大提高。
〔7〕x1:(-,)x2:(,)x3:(-,)
(8)
第8页
(9)
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
10
标准预测值
-
.000
10
预测值的标准误差
10
调整的预测值
10
残差
-
.00000
10
标准残差
-
.000
.816
10
Student化残差
-
-.123
10
已删除的残差
-
-
10
Student化已删除的残差
-
-.255
10
Mahal。距离
.894
10
Cook的距离
.000
.486
.976
10
居中杠杆值
.099
.642
.300
.173
10
:y
所以置信区间为〔,〕
〔10〕由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好
:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,。
在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,。
第四章违背根本假设的情况
加权变化残差图上点的散步较之前的残差图,没有明显的趋势,点的散步较随机,因此加权最小二乘估计的效果较最小二乘估计好。
:
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
-.831
.442
-
.065
x
.004
.000
.839
.000
:y
由SPSS计算得:=-+
残差散点图为:
〔2〕由残差散点图可知存在异方差性
再用等级相关系数分析:
相关系数
x
t
Spearman的rho
X
相关系数
.318*
第10页
相关系数
x
t
Spearman的rho
X
相关系数
.318*
Sig.〔双侧〕
.
.021
N
53
53
T
相关系数
.318*
Sig.〔双侧〕
.021
.
N
53
53
Sig.〔双侧〕
.
.021
N
53
53
T
相关系数
.318*
Sig.〔双侧〕
.021
.
N
53
53
*.在置信度〔双测〕,相关性是显著的。
P=。
〔3〕
模型描述
因变量
y
自变量
1
x
权重
源
x
幂值
模型:MOD_1.
M=,此时得到:
ANOVA
平方和
df
均方
F
Sig.
回归
.006
1
.006
.000
残差
.003
51
.000
总计
.009
52
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
试用版
标准误
〔常数〕
-.683
.298
-
.026
x
.004
.000
.812
.082
.000
所以:-+
〔4〕
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
.582
.130
.000
x
.001
.000
.805
.000
:yy
。如前期消费额对后期消费额一般会有明显的影响,有时,经济变量的这种滞后性表现出一种不规那么的循环运动,当经济情况处于衰退的低谷时,经济扩张期随之开场,这时,大多数经济时间序列上升的快一些。在经济扩张时期,经济时间数列内部有一种内在的动力,受此影响,时间序列一直上升到循环的顶点,在顶点时刻,经济收缩随之开场。因此,在这样的时间序列数据中,顺序观察值之间的相关现象是恨自然的。
,就违背了线性回归方程的根本假设,如果仍然直接用普通最小二乘估计未知参数,将会产生严重后果,一般情况下序列相关性会带来以下问题:
〔1〕参数的估计值不再具有最小方差线性无偏性。