文档介绍:第二节回归分析
河南工业大学
shiyanshujuchulishiyongfangfa
试验设计与数据处理
相关系数只能说明现象间相关关系的方向和程度,关系密切与否,但不能说明一个现象发生一定量的变化,另一个现象一般也会发生多大的变化。
回归分析是研究变量与变量之间相关关系的一种统计推断方法。它是在试验观测数据的基础上,寻找被随机性掩盖了的变量之间的相互依存的关系,以一种确定的函数关系去近似替代比较复杂的相关关系。
Sir Francis Galton
(1822-1911)
高尔顿( Francis Galton)
1822-1911
河南工业大学
shiyanshujuchulishiyongfangfa
试验设计与数据处理
弗兰西斯·高尔顿于1822年生于英格兰,
与达尔文是表兄弟关系,他从小智力超
常、聪颖过人,被誉为神童,是著名的
优生学家、心理学家, 差异心理学之父,
也是心理测量学上生理计量法的创始人,享年89岁。
高尔顿一生在统计学方面贡献很多, 首次
引入了“Regression回归”一词, 第一次使
用了相关系数(correlation coefficient) 的
概念, 并采用字母“ r ”来表示。
高尔顿设计的用来研究随机现象的高尔顿
钉板模型,更是被广泛用来描述正态分布
的经典例子。
高尔顿(Galton)钉板试验
试验模型如下所示:
自上端放入一小球,
任其自由
下落, 在下落过程中当小球碰到钉
子时, 从左边落下与从右边落下的
机会相等.
碰到下一排钉子时又是
如此, 最后落入底板中的某一格子.
因此,
任意放入一球,
则此球落入
哪一个格子,
预先难以确定.
但是如果放入大量小球,
则其最后所呈现的曲线,
几乎总是一样的.
“Regression(回归)”一词是由英国著名人类学家、气象学家和统计学家高尔顿于1885年在其《身高遗传中的平庸回归》一文中首次引入的, 他在研究身高与遗传之间的联系时,观察了1078对夫妇的二人的平均身高 X 以及其一个成年后代的身高 Y, 从中发现在直角坐标系下,二者之间的关系近乎是一条直线,并且得到如下数学关系:
河南工业大学
shiyanshujuchulishiyongfangfa
试验设计与数据处理
一、回归分析的涵义
1、高尔顿试验
结
果
解
释
父辈平均身高每增加或减少
一个单位,其成年后代的身
个
单位。
高尔顿的结论是:
从人类遗传上来说, 父母个子高这一基因会遗传给
他们的后代,导致产生高个子的下一代, 但子代的
身高并不会象其父辈, 出现越来越高的现象, 而是
趋向于比他们父辈身高更加平均的水平。
高尔顿将人类这种遗传现象称为“回归”。人类也
正是由于这种回归, 才能生生不息的繁衍下去。
河南工业大学
shiyanshujuchulishiyongfangfa
试验设计与数据处理
2、何谓回归分析
回归分析-----是对具有相关关系(显著相关以上相关)的两个或两
个以上的变量之间所具有的变化规律进行拟合, 确立一个相应的
数学表达式(经验公式), 通过一个或多个变量的变化去解释另一
变量变化的方法, 以便从定量的角度由已知量推测未知量, 为估
算预测或控制提供重要依据。
简单的说,回归分析就是一种处理具有相关关系的变量与变量
之间关系的数学方法与工具。
河南工业大学
shiyanshujuchulishiyongfangfa
试验设计与数据处理
3、回归分析的内容和步骤
回归分析需要研究和解决的问题主要有以下几方面:
(1)根据理论和对实际问题的分析判断, 区分自变量(即解释变量
或预报变量)和因变量(即被解释变量或响应变量)。
(2)从一组试验数据出发, 判断二者之间是否存在相关关系, 如果存在的话, 设法找出其合适的数学表达式(即回归模型)用来描述变量之间的内在联系。
(3)对建立的回归模型可信程度进行统计检验和推断, 并从影响因
变量的诸多自变量中找出影响显著或不显著的变量。
(4)依据回归模型, 通过自变量的取值来预测或控制因变量的取值,
并给出这种预测或控制的精确程度。
一个预报变量
两个及两个以上预报变量
回归模型
多元回归
一元回归
线性
回归
非线性
回归
线性
回归
非线性
回归
河南工业大学
shiyanshujuchulishiyongfangfa
试验设计与数据处理
4、回归模型的分类
按变量的个数
按回归曲线的
形态
河南工业大学
shiyanshujuchulishiyongfangfa
试验设计与数据处理
5、回归数学模型
(1) 一