文档介绍:回归分析与相关分析
现在学****的是第1页,共61页
相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。
现在学****判断
定量分析
在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度
相关关系的测定
现在学****的是第20页,共61页
简单
相关表
适用于所观察的样本单位数较少,不需要分组的情况
分组
相关表
适用于所观察的样本单位数较多标志变异又较复杂,需要分组的情况
将现象之间的相互关系,用表格的形式来反映。
相关表
现在学****的是第21页,共61页
正 相 关
负 相 关
曲线相关
不 相 关
x
y
x
y
x
y
x
y
又称散点图,用直角坐标系的x轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。
相关图
现在学****的是第22页,共61页
二、一元线性回归测定
现在学****的是第23页,共61页
(一)回归方程中的参数估计
对于经判断具有线性关系的两个变量y与x,构造一元线性回归模型为:
假定E()=0,有总体一元线性回归方程:
现在学****的是第24页,共61页
一元线性回归方程的几何意义
截距
斜率
一元线性回归方程的可能形态
为正
为负
为0
现在学****的是第25页,共61页
总体一元线性
回归方程:
样本一元线性回归方程:
以样本统计量估计总体参数
斜率(回归系数)
截距
截距a 表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。
(估计的回归方程)
(一元线性回归方程)
现在学****的是第26页,共61页
随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响
X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。
现在学****的是第27页,共61页
残差(Residual):
现在学****的是第28页,共61页
一元线性回归模型的假定
现在学****的是第29页,共61页
一元线性回归方程
中参数a、b的确定:
最小平方法
基本数学要求:
现在学****的是第30页,共61页
整理得到由两个关于a、b的二元一次方程组成的方程组:
进一步整理,有:
现在学****的是第31页,共61页
【分析】因为工业总产值与能源消耗量之间存在高度正相关关系( ),所以可以拟合工业总产值对能源消耗量的线性回归方程。
【例】建立工业总产值对能源消耗量的线性回归方程 资料
解:设线性回归方程为
现在学****的是第32页,共61页
即线性回归方程为:
计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),(亿元)。
现在学****的是第33页,共61页
最小二乘法估计的优良性质
残差之和为零
所拟合直线通过样本散点图的重心
误差项与解释变量不相关
a与b分别是总体回归系数的无偏估计量
a与b均为服从正态分布的随机变量
现在学****的是第34页,共61页
(二)标准误差的估计
是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。
现在学****的是第35页,共61页
在大样本条件下,可用公式计算:
【例】计算前面拟合的工业总产值对能源消耗量回归方程的回归标准差 资料
现在学****的是第36页,共61页
剩余离差平方和
回归离差平方和
总离差平方和
现在学****的是第37页,共61页
Lyy=U+Q
总离差平方和
回归离差平方和
剩余离差平方和
现在学****的是第38页,共61页
估计标准差越小,则变量间相关程度越高,回归线对Y的解释程度越高。
判定系数与估计标准差的关系:
现在学****的是第39页,共61页
三、一元线性相关
相关系数:描述两个变量线性关系的密切程度的数量分析指标。
其计算方法有积差法和方差法两种。
现在学****的是第40页,共61页
在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指