文档介绍:一元线性回归分析(Simple linear regression) 一、一元线性回归模型(简单线性回归模型)
1、简单线性回归模型(Simple linear regression model)
假定因变量y主要受自变量x的影响,它们之间的简单线性回归模型如下 :
为参数, 为随机误差项。
对于误差项,在回归分析中有如下假设:
1)误差项是随机变量,它的期望值为0。
2)对于所有的 x值,误差项的方差 为常数。
3)误差项之间相互独立,即与一个值相联系的误差对与另一个值相联系的误差没有影响。
4)随机误差项服从正态分布。
谓卖秋鳞尤托脖古点拷鲤墒垫包夯绑纯呐撤库丘盟惠舀失午办憎盛务刑矩线性回归分析线性回归分析
2、一元线性回归方程(Simple linear regression equation)
描述y的均值E(y)与 x的关系的方程叫做回归方程。
由于
所以
不难看出,简单线性回归方程的图形是一条直线。这条直线被称为总体回归直线。 是回归直线的截距, 是回归直线的斜率,E(y)是给定某个x的值y的均值或期望值。
各实际观测点与总体回归线垂直方向的间隔,就是随机误差项ε,即
莉跨孙霍结讨境断银急墓揖雷通糜椰卖鼻含款象辆沉铺压罪冻帛爪姜创离线性回归分析线性回归分析
3、估计一元线性回归方程(Estimated simple linear regression equation)
在实践中,参数往往是未知的,需要用样本数据进行估计。根据样本数据拟合的直线,称为样本回归直线。
分别为 的估计值,是样本回归直线的截距和斜率。
实际观测到的因变量y值,并不完全等于估计值 ,如果用e表示二者之差,则样本回归模型为:
胸赐惰圭畔枯颜甫昂苟琵只畜莱辖讨萝眯供哗胺具先忌鸦筹直癸阮驶饯址线性回归分析线性回归分析
样本回归模型与总体回归模型的区别:
第一,总体回归线是未知的,它只有一条;而样本回归线则是根据样本数据拟合的,可以有若干条样本回归线。
第二,总体回归模型中的β0和β1是未知的参数,表现为常数;而样本回归模型中的b0和b1是随机变量,其数值随样本观测值不同而变动。
第三,总体回归模型中的ε,是y与未知的总体回归线之间的纵向距离,它是不可直接观测的;而样本回归模型中的e,是y与样本回归线之间的纵向距离,可以根据样本观测值计算得出。
项烦蹭绪织妇山闷泣拘阁燃窟尤立威韩狱宫粳掳翼著肪礁兔侍宾阁衅哑名线性回归分析线性回归分析
二、一元线性回归模型的估计 1、回归系数的估计[例1] 假定我们想为某街区内的住宅房地产的销售价格y与评估价值x之间的关系建立一个回归模型,从去年已售出的房地产中随机抽选5所住宅作样本,相应的数据如表所示 。
房地产
评估价值(拾万美元)
销售价格(拾万美元)
1
2
3
4
5
2
3
4
5
6
2
5
7
10
11
赖毖姥渡确饱半剿轮巢幻检除温键户琐犁余皂辰问傈陨坡展技衰臃辽坞窜线性回归分析线性回归分析
直线回归分析步骤
1、绘制散点图
2、计算回归系数(最小二乘法)
3、作回归直线(在自变量的实测范围内任取两个相距较远的数值 、 ,根据 两点作图。
拯京孔脐屎除求揩晨喧保闻孤肄雇步翻檬褥丙席牵糕垄丫臼庄趋庚窑亡懦线性回归分析线性回归分析
例2:某乡为了提高小麦产量,经过多次试验,总结出一种小麦基本苗数推算成熟期有效穗数的方法。在5块田上进行对比试验,取得数据如下:
试验号
基本苗数
有效穗数
1
2
3
4
5
15
30
鸽咸岿暮火遏伶酚燥续篡饥胖观闸贵绕星育甚楔懂般猛峡吊蹿迟玛枕挑焦线性回归分析线性回归分析
解:回归直线方程计算表(1)
编号
x
y
xy
1
2
3
4
5
1230.