文档介绍:第七章线性相关分析
本讲稿第一页,共三十三页
第一节 相关关系与相关分析
一、变量间的关系
(一)函数关系
设有两个变量 x 和 y ,变量 y 随变量 x的变
化而变化,并完全依赖于 x ,则称 y 是 x
+
0
-
+
完全负相关
无线性相关
完全正相关
负相关程度增加
正相关程度增加
本讲稿第十七页,共三十三页
【例】在研究我为y,把人均为x。我们收集到1981~1993年的样本数据(xi ,yi),i =1,2,…,13,数据见表,计算相关系数。
我国人均国民收入与人均消费金额数据 单位:元
年份
人均
国民收入
人均
消费金额
年份
人均
国民收入
人均
消费金额
1981
1982
1983
1984
1985
1986
1987
249
267
289
329
406
451
513
1988
1989
1990
1991
1992
1993
643
690
713
803
947
1148
本讲稿第十八页,共三十三页
解:根据样本相关系数的计算公式有
人均国民收入与人均消费金额之间的相关系数为
本讲稿第十九页,共三十三页
相关分析的不足:
相关分析只能分析出变量之间是否有相关关系,相关关系的形式、方向和程度。但对于一个变量是如何随着另一个(或一组)变量的变动而变动(即变量之间的数量变动关系)无法说明。
这就需要在相关分析的基础进一步进行回归分析。
本讲稿第二十页,共三十三页
第二节 回归分析
一、回归分析
从一组样本数据出发,确定变量之间的数学关系式
选择适当的回归模型,采用最小二乘法估计回归模型中的待定系数。
利用所求的关系式,来预测或控制另一个特定变量的取值。
本讲稿第二十一页,共三十三页
3、回归分析与相关分析的区别
①相关分析中,变量 x 变量 y 处于平等的地位;
回归分析 中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化。
②相关分析中所涉及的变量 x 和 y 都是随机变量;回归分
析中,因变量 y 是随机变量,自变量 x 可以是随机变量
也可以是非随机的确定变量
③相关分析主要是描述两个变量之间相关关系的密切程度和方向; 回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制
本讲稿第二十二页,共三十三页
二、回归模型的类型
一个自变量
两个及两个以上自变量
回归模型
多元回归
一元回归
线性回归
非线性回归
线性回归
非线性回归
本讲稿第二十三页,共三十三页
三、一元线性回归分析
(一)概念
当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归。
本讲稿第二十四页,共三十三页
(二)一元线性回归模型形式
只涉及一个自变量的简单线性回归模型可表示为:
本讲稿第二十五页,共三十三页
(三)参数 a 和 b 的最小二乘估计
使因变量的观察值(y)与估计值( )
之间的离差平方和达到最小来求回归方程中的待
定系数 a 和 b ,即最小二乘估计法。
本讲稿第二十六页,共三十三页
最小二乘法示图
x
y
(xn , yn)
(x1 , y1)
(x2 , y2)
(xi , yi)
}
^
本讲稿第二十七页,共三十三页
最小二乘法( a 和 b 的计算公式)
本讲稿第二十八页,共三十三页
四、回归方程的评价(估计标准误差 Sy
实际观察值与回归估计值离差平方和的均方根
反映实际观察值在回归直线周围的分散状况,反映回归方程拟合的程度。
计算公式为:
本讲稿第二十九页,共三十三页
五、利用回归方程进行估计和预测(点估计)
对于自变量 x 的任一给定值x0 ,根据回归
方程可得到因变量 y 的一个估计值。
本讲稿第三十页,共三十三页
习题:某地区1998—2003年人均收入与某商品的销售额资料如下: