文档介绍:第十章相关与回归分析
一、回归预测的含义
回归(Regression) 一词是由生物学相关概念引申而来,它是英国生物学家高尔顿( 〉用来描述遗传变异现象的术语。1889年他在《普用回归定律》一文中指出:每个人的特点和他的亲属有相似之处,但平均地说在程度上有一定的差异。他的朋友皮尔逊后来对 1078 个家庭进行了调查,发现个子高的父母比矮的父母趋向于生育个子高的子女,但是从平均数看,父母高, 他们的子女不一定像父母那样高, 反之也不像其父母那样矮。这种现象便称之为回归。后来这个名词被广泛用来表示变量间的数量关系。
回归分析:就是研究某一个随机变量(因变量) 与其他一或几个变量(自变量) 之间的数量变动关系,由回归分析求出的关系式通常称为回归模型。
回归分析预测法:就是从各种经济现象之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测法。
二、回归预测的分类
两个变量之间就其关系变化来说,可以表现为两种数学模型形式, x 表示自变量,y 表示因变量,同时 x 和 y 的关系在一定条件下是完全确定的,那就是函数关系。反之,则是统计型关系。
在社会经济现象中,一个变量和另一变量尽管有密切的关系,但是由于受到众多的难以控制的因素的影响,实际观察得到的数据并不能构成函数关系。例如,企业的年销售额 y 与变量 x( 人均收入、利率的变化、产品的市场竞争状况、季节的变化及原材料的供应等) 对应的关系会形成一个统计分布。随自变量 x 的变化,因变量也随之有一个随机变化结果。其变化的结果所对应的曲线模型有正线性关系、负线性关系、元数量关系、向下抛物线关系、上升指数曲线关系及下降指数曲线关系等。
在回归分析中,如果研究的因果关系涉及两个变量就叫做一元回归分析或单回归分析;如果涉及两个以上的变量,则叫做多元回归分析或复回归分析。如果变量之间的相关关系呈线性变化,则叫线性回归;如果变量之间的相关关系呈非线性变化,则叫非线性回归。
三、回归预测的一般程序
确立相关因素:相关因素又称相关变量,它是回归分析的基础。相关变量选择得准确与否会直接影响回归预测结果的准确性。
建立数学模型:根据已知的数据资料,找出变量之间相关关系的类型,选择与其最为吻合的数学模型,代入已知数据并经过数学运算,求得有关系数或参数,从而建立预测的数学模型。
检验和评价数学模型:建立的数学模型是否正确,必须用一套数理统计方法来加以检验,并测量其误差大小和精确(或近似)程度。
运用模型进行预测:数学模型经检验后如果正确,即用所建的数学模型进行预测和控制。