文档介绍:简单回归分析
*
第1页,此课件共60页哦
第一节 简单线形回归
第二节 线形回归的应用
主要内容
*
第2页,此课件共60页哦
学习目标
①了解回归分析的基本思想。
②熟悉线性回归的基本步骤;哦
回归分析的方法步骤
绘制散点图
求回归系数和常数项
回归系数和常数项的假设检验
列出回归方程,并进行假设检验
回归方程的解释
*
第19页,此课件共60页哦
(一)绘制散点图
图2 车流量与空气中NO浓度关系散点图
从散点图可见:车流量与空气中NO浓度有线性关系,可以考虑做线性回归分析。
*
第20页,此课件共60页哦
(二)求回归系数和常数项
*
第21页,此课件共60页哦
系数估计公式:
回归方程:
*
第22页,此课件共60页哦
*
第23页,此课件共60页哦
本例中
b=;
a=-
*
第24页,此课件共60页哦
参数β的意义:若自变量X增加1个单位,反应变量Y的平均值便增加β个单位。
β=0,说明Y与X之间并不存在线性关系;
β≠0,说明Y与X之间存在线性关系。
理由:从β=0的总体抽得样本,计算出的回归系数b很可能不为零。
方法:回归系数的假设检验可通过t检验实现。
(三)回归系数和常数项的假设检验
*
第25页,此课件共60页哦
t检验
*
第26页,此课件共60页哦
*
第27页,此课件共60页哦
(四)回归方程的假设检验
目的:检验求得的回归方程在总体中是否成立;
方法:单因素方差分析。
*
第28页,此课件共60页哦
因变量 y 的取值是不同的,y 取值的这种波动称为变异。变异来源:
因自变量 x 的取值不同造成的
除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响
对一个具体的观测值来说,变异的大小可以通过该实际观测值与其均值之差 来表示
变异(变差)及其分解
*
第29页,此课件共60页哦
x
y
y
{
}
}
*
第30页,此课件共60页哦
SST = SSR + SSE
总平方和
(SST)
{
回归平方和
(SSR)
残差平方和
(SSE)
{
{
*
第31页,此课件共60页哦
SST是指没有利用X的信息时,Y观察值的变异;
SSE反应回归方程未能解释的那部分变异;
SSR反应回归方程解释的那部分变异。
决定系数(R2)= SSR/ SST,反应了Y的总变异中回归关系所能解释的百分比, R2越大,说明构建的回归方程越好。
*
第32页,此课件共60页哦
表3 简单线性回归模型方差分析表
*
第33页,此课件共60页哦
查F界值表,得P<,说明构建的回归方程具有统计学意义。
研究表明, 车流量和空气中NO浓度存在着线性依存关系:车流量每增加100辆(),×
(五)回归方程的解释
*
第34页,此课件共60页哦
线性回归分析的SPSS过程:
Analyze→ Regression→ Linear
Dependent list框→ Y
Independent list框→ X1
OK
*
第35页,此课件共60页哦
线性回归分析的结果:
*
第36页,此课件共60页哦
第 二 节 线 形 回 归 的 应 用
*
第37页,此课件共60页哦
一、 总体回归线的95% 置信带
二、个体Y预测值的区间估计
*
第38页,此课件共60页哦
一、 总体回归线的95% 置信带
*
第39页,此课件共60页哦
*
第40页,此课件共60页哦
二、个体Y预测值的区间估计
总体中,当XP为某一固定值时,个体Y值围绕着对应于XP值的总体均数波动,其分布的标准差按下式估计:
*
第41页,此课件共60页哦
即
*
第42页,此课件共60页哦
图5 空气中NO浓度(Y)与车流量(X)回归 线的95%置信带与Y个体值的95%预测带
*
第43页,此课件共60页哦
直线回归方程的应用
(一)定量描述两变量之间的依存关系。
(二)利用回归方程进行预测。
(三)利用回归方程进行统计控制。
*
第44页,此课件共60页哦
简单线性回归分析的注意事项
;
;
。
*
第45页,此课件共60页哦
小结
相关分析是用来描述两变量的相关关系,当两变量满足双变量正态分布时,可以计