1 / 12
文档名称:

回归分析的应用 10.doc

格式:doc   大小:189KB   页数:12页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

回归分析的应用 10.doc

上传人:drp539603 2017/9/9 文件大小:189 KB

下载得到文件列表

回归分析的应用 10.doc

文档介绍

文档介绍:第10章含定性变量的回归模型
一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。出现这种情况的原因是什么?
答:假如这个含有季节定性自变量的回归模型为:
其中含有k个定量变量,记为xi。对春夏秋冬四个季节引入4个0-1型自变量,记为Di,只取了6个观测值,其中春季和夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:
显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。
当某自变量xj对其余p-1个自变量的复判定系数超过一定界限时,SPSS软件将拒绝这个自变量xj进入回归模型。称Tolj=1-为自变量xj的容忍度(Tolerance),。也就是说,当>,自变量xj将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。
而在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。
,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?
答:原因有两个,。一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。
研究者想研究采取某项保险革新措施的速度y对保险公司的规模x1和保险公司类型的关系(参见参考文献【3】)。因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。第一个自变量公司的规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司是定性变量,由两种类型构成,即股份公司和互助公司。,试建立y对公司规模和公司类型的回归。

i
y
x1
公司类型
1
17
151
互助
2
26
92
互助
3
21
175
互助
4
30
31
互助
5
22
104
互助
6
0
277
互助
7
12
210
互助
8
19
120
互助
9
4
290
互助
10
16
238
互助
11
28
164
股份
12
15
272
股份
13
11
295
股份
14
38
68
股份
15
31
85
股份
16
21
224
股份
17
20
166
股份
18
13
305
股份
19
30
124
股份
20
14
246
股份
解:对定型变量“公司类型”进行数量化处理:
引入虚拟变量x2:公司类型为“互助”时,x2=1,为“股份”时, x2=0。
:
i
y
x1
公司类型
1
17
151
1
2
26
92
1
3
21
175
1
4
30
31
1
5
22
104
1
6
0
277
1
7
12
210
1
8
19
120
1
9
4
290
1
10
16
238
1
11
28
164
0
12
15
272
0
13
11
295
0
14
38
68
0
15
31
85
0
16
21
224
0
17
20
166
0
18
13
305
0
19
30
124
0
20
14
246
0
建立回归方程 y=b0+b1x1+b2x2+ε
用SPSS软件作线性回归,得到输出结果如下:
R检验:拟合优度R2=,接近1,说明回归拟合的效果较好。
F检验:F值=,,说明回归方程通过F检验。
T检验:回归系数通过t检验,回归方程为:
y= - x1- x2
说明:若引入虚拟变量x2,当公司类型为“互助”时,x2=0,为“股份”时, x2=1。
则回归方程为:
y= - +
结果分析:
(1)股份制公司采取保险革新措施的积极性比互助型公司高,原因可能在于股份制公司建立在共同承担风险上,所以更愿意革新;
(2)公司规模越大,采取保险革新措施的倾向越大:大规模公司的保险制度的更新对公司的影响程度比小规模公司大,因此大规模公