文档介绍:第四章多元线性回归分析
Multiple Linear Regression Analysis
本章主要讲授内容:多元线性回归分析的意义;多元线性回归方程的建立及其显著性测验;对各偏回归系数的显著性测验,最优多元线性回归方程的建立;评价各个自变数对依变数影响的相对重要性等。
1
第一节多元线性回归分析的意义
我们知道,简单线性回归分析是依变数y在一个自变数x上的回归。然而在许多实际问题中,影响依变数的自变数往往不只是一个,而是多个。因此,在研究工作初期,为了简化头绪,“逐个击破”,进行一元回归分析是非常必要的,但在进一步研究时,必须进行综合研究,即将多个和反应量(依变数y)有关的自变数综合起来研究。
依变数依两个或两个以上自变数的回归叫多元回归或复回归(multiple regression)。
2
多元回归有多种类型(如多元线性回归、多元非线性回归、正交多元回归等),而其中最简单、常用、具有基础性质的是多元线性回归分析。
多元线性回归分析的思想、方法和原理与简单线性回归分析基本相同,但会涉及一些新概念及更细致的分析,尤其是计算要繁杂些,当自变数较多时可借助计算机进行计算。
3
多元回归分析的基本任务有:
1. 确定各自变数对某一依变数的各自效应,即分别计算出任一自变数(在其它自变数保持一定时)对依变数的效应,此效应叫偏回归系数(partial regression coefficient)。
2. 建立由各个自变数描述和预测依变数的多元回归方程,即确定各个自变数对某一依变数的综合效应。
3. 对上述自变数对依变数的单独效应和综合效应进行显著性测验。
4
4. 测定回归方程的偏离度(即计算离回归标准误)。
5. 选择对依变数有显著效应的自变数,建立最优多元线性回归方程。
6. 评定各个自变数对于依变数影响的相对重要性,以利于抓住关键因素,达到调整和控制依变数反映量的目的。
5
第二节多元线性回归方程
一、多元线性回归的数学模型
设有m个自变数,以变数为y,共有n组实际观测数据,则可以整理为表1。假如y与x1、x2、…… xm之间存在线性关系,则m元线性回归模型为:
对于样本:
6
表1 多元线性回归资料整理表
组数
自变数 x
依变数
y
x1 x2 ……… xm
1
2
┇
n
x11 x21 ……… xm1
x12 x22 ……… xm2
┇┇┇
x1n x2n ……… xmn
y1
y2
┇
yn
( i=1,2, … m ;j=1,2, … n )
7
在回归模型中:α为x1、x2、…xm皆取0时的y总体的理论值;βi为在其它自变数x固定时xi对y的偏回归系数,例如β1表示x2、x3、…xm皆保持一定时,x1每增加一个单位对y总体的的平均效应,叫做x2、x3、…xm固定时,x1对y的偏回归系数,其余同; 为y依x1、x2、…xm的条件总体平均数(简写作);εj为m元随机误差,仍假定遵循。
8
二、多元线性回归方程的建立
仍采用的是“最小平方法”,即离回归平方和最小。
9
在上述正规方程组中,SSm表示自变数x的平方和,SP12、SP1m…表示两个x变数的乘积和。解上述方程组,可得b1、b2、…bm的解。然后计算回归截距a:
于是可得回归方程:
回归方程的另外一种表达式:
10