文档介绍:第8章相关与回归分析回归分析广义上的回归分析,同时包括狭义的相关分析与回归分析的全部内容,亦即本章既研究现象间相互依存关系的密切程度,又研究现象之间数量相关的具体形式。
重点:明确相关关系,函数关系,因果关系,掌握基本的回归分析和预测方法,能应用实际资料构建一元线性回归模型,并借助计算机进行系统分析。
难点:多元线性回归分析和预测方法的准确运用。
第1节变量间关系的度量一、变量间的相互关系
1、相关关系
函数关系,是指当一个或几个变量取一定的值时,另一个变量有确定值与之相对应的确定性关系。
相关关系,是指当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值按某种规律在一定的范围内发生不确定性的变化。
2、相关关系的种类
正相关和负相关
完全相关、不完全相关和完全不相关
线性相关和非线性相关
单相关和复相关
二、相关关系的描述与测度
1、散点图
2、相关系数
3、相关表
三、相关关系的显著性检验
1、提出假设
2、确定显著水平
3、计算统计量
4、比较
5、决策
第2节一元线性回归分析(Simple linear regression) 一、一元线性回归模型(简单线性回归模型)
1、简单线性回归模型(Simple linear regression model)
假定因变量y主要受自变量x的影响,它们之间的简单线性回归模型如下:
为参数, 为随机误差项。
对于误差项,在回归分析中有如下假设:
1)误差项是随机变量,它的期望值为0。
2)对于所有的 x值,误差项的方差为常数。
3)误差项之间相互独立,即与一个值相联系的误差对与另一个值相联系的误差没有影响。
4)随机误差项服从正态分布。
2、一元线性回归方程(Simple linear regression equation)
描述y的均值E(y)与 x的关系的方程叫做回归方程。
由于
所以
不难看出,简单线性回归方程的图形是一条直线。这条直线被称为总体回归直线。是回归直线的截距, 是回归直线的斜率,E(y)是给定某个x的值y的均值或期望值。
各实际观测点与总体回归线垂直方向的间隔,就是随机误差项ε,即
3、估计一元线性回归方程(Estimated simple linear regression equation)
在实践中,参数往往是未知的,需要用样本数据进行估计。根据样本数据拟合的直线,称为样本回归直线。
分别为的估计值,是样本回归直线的截距和斜率。
实际观测到的因变量y值,并不完全等于估计值,如果用e表示二者之差,则样本回归模型为:
样本回归模型与总体回归模型的区别:
第一,总体回归线是未知的,它只有一条;而样本回归线则是根据样本数据拟合的,可以有若干条样本回归线。
第二,总体回归模型中的β0和β1是未知的参数,表现为常数;而样本回归模型中的b0和b1是随机变量,其数值随样本观测值不同而变动。
第三,总体回归模型中的ε,是y与未知的总体回归线之间的纵向距离,它是不可直接观测的;而样本回归模型中的e,是y与样本回归线之间的纵向距离,可以根据样本观测值计算得出。
二、一元线性回归模型的估计 1、回归系数的估计[例1] 假定我们想为某街区内的住宅房地产的销售价格y与评估价值x之间的关系建立一个回归模型,从去年已售出的房地产中随机抽选5所住宅作样本,相应的数据如表所示。
房地产
评估价值(拾万美元)
销售价格(拾万美元)
1
2
3
4
5
2
3
4
5
6
2
5
7
10
11
直线回归分析步骤
1、绘制散点图
2、计算回归系数(最小二乘法)
3、作回归直线(在自变量的实测范围内任取两个相距较远的数值、,根据两点作图。