1 / 119
文档名称:

数学模型课件.pptx

格式:pptx   大小:2,113KB   页数:119页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数学模型课件.pptx

上传人:miao19720107 2022/6/9 文件大小:2.06 MB

下载得到文件列表

数学模型课件.pptx

相关文档

文档介绍

文档介绍:回归模型是用统计方法建立的最常用的一类模型.
机理分析和统计分析是数学建模的两种基本方法
通过对数据的统计分析找出与数据拟合最好的模型.
不涉及回归分析的数学原理和方法 .
通过实例讨论如何选择不同类型的回归模型 .
对软件得到的孕期x和新生儿体重y
x
y
拟合直线 y=b0+b1x
一元线性回归模型 y=b0+b1x+ε
随机变量ε ~ 除x外, 影响y的随机因素的总和,对于不同的x,ε相互独立且服从N(0,σ2)分布.
系数
系数估计值
系数置信区间
b0
-
[- -]
b1

[ ]
R2=, F=154 , p<, s2 =249
b1置信区间不含零点, F=154 >>F(1,n-2)= (=),应拒绝H0: b1=0的假设,模型有效。
b1置信区间较长,决定系数R2较小(%由x决定),剩余方差s2较大,模型的精度不高.
480位吸烟孕妇数据 x,y
模型求解
怀孕期x, 新生儿体重y
模型检验

吸烟孕妇怀孕期增加一天, oz.
不是x=0时y的估计, 只能在数据范围内(x=220~340天) 估计.
一元线性回归模型 y=b0+b1x+ε
怀孕期x, 新生儿体重y
模型解释
模型预测
模型精度不高导致预测区间如此之大!
一元线性回归模型 y=b0+b1x+ε
怀孕期x, 新生儿体重y
~误差ε的估计值(均值为0的正态分布)
若数据残差的置信区间不含零点,称为异常点(偏离整体数据的变化趋势),应剔除。
系数
系数估计值
系数置信区间
b0
-
[- -]
b1

[ ]
R2= F=196 p< s2 = 182
虽然b0和b1的估计值变化不大,但置信区间变短,且R2 和F变大,s2减小,说明模型精度得到提高.

一元线性回归模型 y=b0+b1x+ε
怀孕期x, 新生儿体重y
系数
系数估计值
系数置信区间
b0

[ ]
b1

[ ]
R2= F=90 p< s2 = 181
690位不吸烟孕妇数据x,y (剔除异常点后)
不吸烟孕妇怀孕期增加一天,.
,二者相差很大!
将吸烟状况作为另一自变量,建立新生儿体重与2个自变量的回归模型,利用全体孕妇数据进行分析.

多元线性回归分析
y~新生儿体重, x1~孕妇怀孕期, x2=0,1 ~不吸烟, 吸烟.
模型 y=b0+b1x1+b2x2+ε
x1相同时,.
对于吸烟状况x2相同的孕妇,.
.
与参数估计的数值相同,但增加了x1相同的条件.
1145位全部孕妇数据 (剔除异常点后)
多元线性回归分析
系数
系数估计值
系数置信区间
b0

[ ]
b1

[ ]
b2
-
[- -]
b3

[ ]
R2= F=145 p< s2 =183
模型 y=b0+b1x1+b2x2+ε
模型有效, 但是R2较小, s2较大, 仍有改进余地.
增加乘积项x1x2 ~ x1和x2对y的综合影响
y=b0+b1x1+b2x2+b3x1x2+ε
x2=0
x2=1
不吸烟孕妇的一元模型
吸烟孕妇的一元模型

变量选择与逐步回归
CHDS提供的数据中除孕妇怀孕期和吸烟状况外,还有孕妇怀孕时的年龄、体重、身高和胎次状况.
变量选择 ~ 从应用的角度希望将所有影响显著的自变量都纳入模型,又希望最终的模型尽量简单.
逐步回归 ~ 迭代式的变量选择方法