文档介绍:概率论与数理统计
*
你现在浏览的是第一页,共37页
“回归” 一词的历史渊源
“回归”一词最早由Francis Galton引入。
十九世纪,英国生物学家兼统计学家高尔顿研究发现:
其中x表示父亲身高, y 表示成年儿子的身高(单位:英寸,1英寸=)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。
*
你现在浏览的是第二页,共37页
§
变量之间的关系
确定性关系
非确定性关系(相关关系)
*
你现在浏览的是第三页,共37页
对变量间统计依赖关系的考察主要是通过相关分析
(correlation analysis)或回归分析(regression analysis)
来完成的。
对于相关关系,虽然不能求出变量之间精确的函数关系式,
但是通过大量的观测数据,可以发现它们之间存在一定的
统计规律性。
*
你现在浏览的是第四页,共37页
回归分析是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。
分为:一元线性回归、多元线性回归、可线性化的非线性归
(双曲线、指数、对数、二次、幂函数等)
*
你现在浏览的是第五页,共37页
基本方法
考察随机变量Y与普通变量x之间的相关关系.
,
在一定范围内,若施肥量大,亩产也较高。
问题: Y是怎样依赖施肥料量x的变化的。
问题的特征:
x是普通变量, Y是随机变量.
处理方法:
按数理统计处理问题的方法。
*
你现在浏览的是第六页,共37页
(1) 先进行一些试验, 分别取不同的值
Y也得到 个相应观察值
得到n对数据对,称为样本数据点
(2) 散点图
Y
x
o
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
*
你现在浏览的是第七页,共37页
(3) 寻找Y与x的数量关系:
其中
一般地,
,
*
你现在浏览的是第八页,共37页
例1 合金的强度y (×107Pa) 与合金中碳的含量x (%) 有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi),i=1,2,,n。本例中,我们收集到12组数据,列于表1中
进行回归分析首先是回归函数形式的选择。
当只有一个自变量时,通常可采用画散点图 的方法进行选择。
*
你现在浏览的是第九页,共37页
表1 合金钢强度y与碳含量x的数据
序号
x(%)
y (×107Pa)
序号
x(%)
y (×107Pa)
1
7
2
8
3
9
4
10
5
11
6
12
*
你现在浏览的是第十页,共37页