文档介绍:多元线性回归和相关分析
多元线性回归分析
多元线性回归分析(multiple linear regression analysis)的定义:
通过建立关系方程式,实现用(≥2)个自变数来预测依变数及对预测精度给出评价的统计分析,当自变数与依变数间的关系为线性时此分析称之为多元线性回归分析。
多元回归分析的内容:
①建立由各个自变数预测依变数反应量的多元回归方程,即确定各个自变数对依变数的单独效应和综合效应;
②对上述单独和综合效应的显著性进行测验;
③评价各个自变数对依变数的相对重要性。多元回归分为线性和非线性,本章只介绍多元线性回归分析。
一、多元线性回归分析的数据结构
多元线性回归分析的数据结构如下:
Y1
Y2
……
Yn
X11
X12
……
X1n
X21
X22
……
X2n
……
……
……
……
Xk1
Xk2
……
Xkn
二、多元线性回归分析的数学模型
多元线性回归分析的数学模型为:
三、建立正规方程组和求出回归方程式
多元线性回归方程形如:
按照最小二乘原理b1、b2、…、bK可依以下矩阵方程求出。
AB=C
其中,系数矩阵、解向量和常数向量分别为:
,,
这样,就有 B = A-1C 以及,多元回归截距
四、回归关系及各偏回归系数的假设检验
1、在H0:多元回归关系不显著的假设下,可由以下两个方差构成对这一假设的F测验。
回归平方和:,具有自由度:k ;
离回归平方和:,具有自由度:n-k-1 ;
这样,
2、在的假设下,可构成如下方差分析。
第i个自变量的贡献平方和:,式中为系数矩阵的逆矩阵A-1的第个对角线元素,其占有1个自由度。
这样,
五、多元线性回归方程实例
利用[]讲解多元回归分析全过程。
第二节二次多项式回归分析
回归模型为线性仅是回归分析中的特例,一般情况下其模型均会有自变量的高次方效应模式。
一、二次多项式回归分析的数据结构及整理
Y1
Y2
……
Yn
X11
X12
……
X1n
X21
X22
……
X2n
……
……
……
……
Xk1
Xk2
……
Xkn
从上表看出,其数据结构和多元线性回归分析的数据结构是完全一样的。由于各自变量有二次效应模式存在,故其回归方程包括下列效应项:
,
因此,若算上常数项a方程共有效应项项,故试验点数n不能小于该值,以为离回归留出出足够的自由度。
原始资料整理成具有如下效应项的资料:
( ;)
二、二次多项式回归分析的步骤
原始资料按如上整理后,其统计分析步骤与多元线性回归分析完全相同。
可以得到如下线性化的回归方程:
其得到的回归方程的回归关系和各偏回归系数的显著性检验亦完全一样。
三、二次多项式回归分析举例
讲解书中例[]。
第三节多元相关和偏相关分析
一、多元相关的定义
多元相关(multiple correlation)为表达k + 1个变数中任一变数和其余k个变数的总相关密切程度的量值。
二、多元相关系数的计算
多元相关系数系数可依下式计算:
;
式中,U的计算方法与视与m个自变数对应的单独的1个依变数