文档介绍:第6章线性回归的基本思想——双变量模型
第6章线性回归的基本思想
——双变量模型
63>.1 回归的含义
总体回归函数
总体回归函数的统计或随机设定
随机误差项的性质
样本回归函数
“线性”回归的特殊含义
从双变量回归到多元线性回归
参数估计:普通最小二乘法
综合
一些例子
总结
回归的含义
回归分析是用来研究一个变量(称之为被解释变量explained variable 或应变量 dependent variable)与另一个或多个变量(称之为解释变量 explanatory variable 或自变量 independent variable)之间关系的一种分析方法。
例如研究商品的需求量与该商品的价格、消费者的收入以及其他同类商品的价格之间的关系。
通常我们用Y表示应变量,用X表示自变量。
回归分析是用来处理一个应变量与另一个或多个自变量的关系,但它并不一定表明因果关系的存在。两个变量是否存在因果关系,哪一个是应变量,哪一个是自变量是由正确的经济理论决定的。
需要注意的是具有因果关系的变量之间一定具有数学上的相关关系,而具有相关关系的变量之间并不一定具有因果关系。
例如:中国的国内生产总值与印度的人口之间具有较强的相关性(相关系数较高),因为二者都以较快的速度增长,但显然二者之间不具有因果关系。
回归分析的应用
(1)通过已知变量的值来估计应变量的均值
(2)根据经济理论建立适当的假设并对其进行检验
(3)根据自变量的值对应变量的均值进行预测
(4)上述多个目标的综合
总体回归函数:假想一例
下面我们通过一个具体例子说明回归分析的用途。
均值
31
34
25
23
32
18
16
19
10
15
10
33
32
31
25
18
20
18
16
14
13
9
31
32
30
24
22
22
21
17
15
12
8
30
28
32
26
25
23
23
20
18
18
7
32
30
33
29
27
25
26
22
20
15
6
28
27
29
30
29
28
27
26
24
23
5
31
30
30
31
30
30
29
28
27
33
4
34
33
31
34
32
33
31
30
29
25
3
40
39
35
39
37
36
34
31
31
27
2
46
45
43
42
40
38
36
35
33
28
1
375
350
325
300
275
250
225
200
175
150
消费者
每周博彩支出
个人可支配收入
表6-1 每周博彩支出和每周个人可支配收入
分析步骤:
(1)以个人可支配收入X为横轴,每周博彩支出量Y为纵轴,对表中数据作散点图。
(2)分析两变量间的关系
(3)做出总体回归直线
见Excel文件。
总体回归函数PRF
B1和B2是参数(parameters),也称回归系数(regression coefficients)。
B1又称为截距(intercept),B2又称为斜率(slope)。斜率度量了X每变动一个单位,Y的均值的变化率。
Y的条件期望,可简写为E(Y)
注意:回归分析是条件回归分析(conditional regression analysis)。
(6-1)
总体回归函数的统计或随机设定
}u
随机总体回归方程(stochastic PRF)
ui表示随机误差项(random error term),简称误差项。
0
150
300
X
Y
每周个人可支配收入(美元)
每周博彩支出(美元)
25
}u
.
.
.
(6-2)
随机误差项的性质
(1)在解释变量中被忽略的因素的影响;
(2)变量观测值的观测误差的影响;
(3)模型关系的设定误差的影响;
(4)其它随机因素的影响包括人类行为中的一些内在随机性;
(5) 奥卡姆的剃刀原则——“简单优于复杂”。
样本回归函数
如何估计总体回归函数,即求参数B1、B2呢?
前面我们已经介