文档介绍:管理统计学第13章_相关数列分析
第13章相关数列分析
本章主要阐述如何测定变量之间相关关系的紧密程度,以及如何用数学模型来描述具有相关关系的变量之间的联系形式。前者为相关分析,后者为回归分析、相关分析是回归分析的前提。
133>.1 相关分析
一元线性回归
多元线性回归
非线性回归
时间数列自回归
湖南商学院信息系龚曙明
相关分析
相关关系的概念
现象间的关系有两种类型:
。指现象之间存在着严格的依存关系,即变量之间依一定的函数形式形成的一一对应的关系称为函数关系。
。又称统计关系,是指两个变量之间存在某种依存关系,但变量 y 并不是由变量 x 唯一确定的,它们之间没有严格的一一对应关系。
相关关系的种类
,可分为单相关与复相关。
2. 按相关关系的表现形式,分为直线相关和曲线相关。
3. 按相关关系的变动方向,分为正相关和负相关。
4. 按相关关系是否涉及有关影响因素,分为因相关和自相关。
简单相关系数
相关分析的内容主要是研究现象之间有无关系,相关关系的表现形式和密切程度。相关分析的方法主要有相关图表和相关系数等。当变量y与变量x之间具有线性相关时,可用简单相关系数测定它们之间的密切程度。计算公式为:
简单相关系数 r 的取值范围为
-1≤r ≤1
其中, 为 x 与 y 变量的协方差, 为x变量的标准差, 为 y 变量的标准差, 、分别表示变量 y 和 x 的 n 个数据的平均值。
当 r <1时,则 x 与 y 之间为负相关,r >1时,则x 与 y 之间为正相关。
当r =1时,则 x 与 y 是完全正相关,r =-1时,则x 与 y 是完全负相关。在这两种情形下,两个变量之间的关系是函数关系。当r =0 时,则 x 与 y 之间不存在线性相关关系,但有可能存在非线性相关关系。通常有下列判别标准:
r <,无相关;
≤r<,低度相关;
≤r<,中度相关;
r ≤,高度相关。
[]
需要指出的是,测定简单相关系数时,x 与 y 两个变量是对等的关系,即所研究的两个变量不分彼此,谁作 x ,谁作 y 都可以;两个变量只能算出一个相关系数,其值大小反映两变量之间的密切程度;计算相关系数要求两个变量必须都是随机的。
相关指数
简单相关系数只适用于两个变量间的直线相关的测定。而不适用于曲线相关和复相关的测定。若要测定曲线相关或复相关的紧密程度,则需要先进行回归分析,求出回归方程后,再由自变量 x 求出因变量 y 的估值,用下列公式计算相关指数( R ):
(―1≤R≤1)
相关指数是一种广义的相关系数,线性相关与曲线相关,单相关与复相关均可应用。对于简单线性相关而言,相关指数与相关系数是一致的。但是对于曲线相关与复相关而言,相关指数与简单相关系数在含义上是不同的。
时间数列自相关
时间数列自相关是指某个变量( y )自身随时间不同,其数值在前后时期之间表现出一定的依存关系。或者说,任一具体时期的数值都和它前一期或前几期的数值之间存在一定的联系。研究时间数列本身的相关关系,对于分析社会经济现象发展变化的规律性和进行预测,具有重要的意义。
时间数列自相关也有正相关与负相关,直线相关与曲线相关,简单相关与复相关等不同的形态。下面着重介绍简单的直线自相关,即本期与前期或某一期数值相关。
设为y 数列 t 期的数值, 为 y 数列 t-i 期的数值,I 可以为1,亦可为2,3,4……等等,但必须固定递推期。则自相关系数计算公式为:
[]
一元线性回归
一元线性回归模型
如果两个变量之间存在相关关系,并且一个变量(自变量)的变化会引起另一个变量(因变量)按某一线性关系变化,则两个变量间的关系可用一元线性回归模型描述:
y=a+bx+e
式中:a、b 为回归系数,a为回归直线的截距,b为回归直线的斜率,e 是误差项。一元线性回归模型具有以下特点:
y 、x 之间必须存在着真实的线性相关关系;
y 、x 之间不是对等的关系,一个是因变量,一个是自变量。
y 是随机变量,自变量x是非随机变量,是给定的数值。
b 有正负之分,b 为正值,则 x 与 y 之间正相关;b 为负值,x 与 y 之间负相关。
一元线性回归模型的参数估计
一元线回归模型的 a、b 参数,通常采用最小二乘法估计。其要求是误差项 e