文档介绍:线性回归分析——双变量模型
线性回归分析
双变量模型
回归分析的含义
回归分析是研究一个叫做因变量的变量对另一个或多个叫做解释变量的变量的统计依赖关系。其用意在于,通过解释变量的已知值或给定值去估计或预测因变量的总体均值。
双变量回归分析:只考虑一个解释变量。(一元回归分析,简单回归分析)
复回归分析:考虑两个以上解释变量。(多元回归分析)
术语与符号
自变量
(independent variable)
解释变量
(explanatory variable)
控制变量
(control variable)
预测变量
(predictor variable)
回归元
(regressor)
因变量
(dependent variable)
被解释变量
(explained variable)
响应变量
(response variable)
被预测变量
(predicted variable)
回归子
(regressand)
X
Y
统计关系与确定性关系
统计(依赖)关系:非确定性的关系。在统计依赖关系中,主要处理的是随机变量,也就是有着概率分布的变量。特别地,因变量的内在随机性是注定存在的。
例如:农作物收成对气温、降雨、阳光以及施肥的依赖关系便是统计性质的。
这些解释变量固然重要,但是并不能使我们准确地预测农作物的收成。
确定性关系:函数关系。例如物理学中的各种定律。
回归与因果关系
回归分析研究因变量对于解释变量的统计依赖关系,但并不一定意味着因果关系。一个统计关系式,不管多强和多么具有启发性,都永远不能确立因果联系。
因果关系的确立必须来自于统计关系以外,最终来自于这种或那种理论(先验的或是理论上的)。
回归分析与相关分析(一)
相关分析:用相关系数测度变量之间的线性关联程度。例如:测度统计学成绩和高等数学成绩的的相关系数。假设测得03>.90,说明两者存在较强的线性相关。
回归分析:感兴趣的是,如何从给定的解释变量去预测因变量的平均取值。例如:给定一个学生的高数成绩为80分,他的统计学成绩平均来说应该是多少分。
回归分析与相关分析(二)
在相关分析中,对称地对待任何两个变量,没有因变量和解释变量的区分。而且,两个变量都被当作随机变量来处理。
在回归分析中,因变量和解释变量的处理方法是不对称的。因变量被当作是统计的,随机的。而解释变量被当作是(在重复抽样中)取固定的数值,是非随机的。
(把解释变量假定为非随机,主要是为了研究的便利,在高级计量经济学中,一般不需要这个假定。)
双变量回归模型
(一元线性回归模型)
双变量回归模型
(最简单的回归模型)
模型特点
因变量(Y)仅依赖于唯一的一个解释变量(X)。
回归分析的内容与目的
1、通过样本数据去估计出因变量与解释变量的统计依赖关系式(总体回归函数);
2、给定解释变量的取值,去估计因变量的均值;
3、假设检验;
4、根据样本外解释变量的取值,预测因变量的均值。
总体回归函数
(Population regression function,PRF)
以函数形式(方程、模型)揭示出来的因变量与解释变量的统计依赖关系式。
回归分析的最终目的
估计出总体回归函数
估计总体回归函数的首要任务
设定总体回归函数的合理形式
假想例子
对每周博彩支出和每周个人可支配收入作回归分析。
因变量:每周博彩支出
解释变量:每周个人可支配收入
例子说明
在一个假想的经济社会中,共有100个人参与博彩。个人可支配收入分为10档,每档收入对应的博彩支出有10种情况。
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
150 175 200 225 250 275 300 325 350 375
每周个人可支配收入( X)
总体回归曲线
每周个人博彩支出
Y
条件均值
“线性”一词的含义
线性的含义
对变量为线性
对参数为线性
从现在起,线性回归总是指对参数为线性的一种回归,也即参数总是以它的一次方出现。对于解释变量以什么方式进入模型则没有特别限制。
(线性)总体回归函数(曲线)
*
*
*
*
*