1 / 14
文档名称:

最小二乘法数据拟合与回归.docx

格式:docx   大小:236KB   页数:14页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

最小二乘法数据拟合与回归.docx

上传人:guoxiachuanyue014 2022/5/15 文件大小:236 KB

下载得到文件列表

最小二乘法数据拟合与回归.docx

相关文档

文档介绍

文档介绍:最小二乘法数据拟合与回归
简介:
本文主要对PRML—书的第一章总结,结合moore关于回归的课件Predictingrea卜valuedoutputs:anintroductiontoregression
什么是回归(.
考虑order为M的多项式曲线,可以表述为下面的形式:
AJ
卩他W)=血+助需+物/+…+3艇廿"=£明£
曲线拟合的目标可以表述为优化是的下面的E(W)最小化(当然你可能会选取不同的errorfunction这只是其中一种而已):
]"
Eg)={3/(^n>W)-tn}2
对于取到最小值的”我们表示为T,最优的最小距离是(-:;;'<
如果我们选择不同的order值即M不同的多项式曲线去拟合,比如取M=0,1,3,9最小二乘法拟合的结果如下图:
可以看到M=9的情况,曲线和采样观察点拟合的很好但是却偏离了整体,不能很好的反映,这就是传说中的overfitting过度拟合问题。
越高的order值M,对应越flexible的曲线,能够对采样点更好的逼近,毕竟高order的曲线包含了(可以表示)所有低order的曲线。另外
是包含所有order的,所以可以预见M越大对采样点拟合越好。但是从上图可以看出越大的M越flxible的曲线则对于噪声越敏感。
上面提到过度拟合问题,那么如何评判是否过度拟合呢?我们的终极目标是什么呢,终极目标是:
对于一个新的data,我们可以给出精确的值预测,即对于新的'•…给出精确的估计
我们可以采用另外生成一个test数据集比如100个数据,对于每个M值,计算对于训练
集trainningdata的''和对于测试集testdata的''•。有的时候
可能用下面的误差函数更好:
Erms=\/2E(w*)/N
这样可以使得对于不同的N即数据集合的大小有一个公平的比较基准。
Graphsoftheroot-mean-squsreerrorPdefinedby(1r3)„evaluatedonthetrainingsetandonanindependenttestsetforv^riousvaluesofAL
对于过度拟合问题,如果增加观察点,贝y可以看到过度拟合的问题得以缓解,如下图m=9:
数据集合的大小越大,我们可以承受的模型复杂度越大。一个常见做法是数据(datapoints)应该多于参数数目的一定倍数(如,5,10)才能取得较好的效果。
在第3章中我们会看到,参数的数目并不是模型复杂度最好的度量。
同时很不爽的是我们需要根据训练集合的数据大小(sizeoftheavailabletrainingset)来限制模型的参数数目。看上去更自然的是根据要解决问题的复杂度来选择模型的复杂度。
我们将要看到最小二乘法和最大似然法是一致的(前面的单一参数线性回归的例子已经给了一个证明:)。如果采用贝叶斯方法,过度拟合问题可以避免。从贝叶斯的角度,实施用一个参数数目远多于datapoints的模型是可行的,事实上在贝叶斯模型,有效的参数数目可以根据dataset的大小自动调整。
当下从最小二乘法的角度,为了解决过度拟合的问题,我们可以改变优化目标,加入reularization,限制|w|的值过大。
E(w)=£±{讥叽w)
n=1

考虑仍一个硬币3次,假如我们3次观察到的结果都是背面,那么从最大似然的角度,我们会判定硬币观察到背面的可能性是100%,而如果我们有一定的先验知识我们不会得出这种结论。
考虑我们有红色和蓝色两个盒子,红色的盒子里面有2个苹果6个橘子,蓝色的盒子有3
个苹果1个橘子。
假定我们选取红色盒子的概率是40%,选取蓝色盒子的概率是60%,那么我们从2个盒子中取到一个苹果的概率是(2/(2+6))*+
(3/(3+1))*=+==11/20,。
假定我们被告知我们取到了一个水果这个水果是橘子,那么我们是从哪个盒子里面取到它的呢?这个盒子是红色的可能性多大呢?显然直观的想试红色盒子的可能性不再是40%了(先验知识P(B=r)),而是变得更大了,因为红色的盒子里面更有可能取到橘子。即在知道取到是橘子的情况下盒子是红色的概率变大了(后验概率P(B=r|F=o),注意假如橘子在红色和蓝色中出现的可能性相同P(F=o)和P(F=o|B=r)相同则后验概率与先验概率相同,这个时候P(B=r)=P(B=r|F=o)即取到的水果和选取的盒

最近更新

2024年音乐课工作计划 20页

2024年面试音乐老师自我介绍(合集15篇) 13页

2024年面试自我介绍[实用14篇] 16页

2024年青春的舞步作文5篇 8页

2024年青年教师汇报课教学反思范文 8页

科普知识竞赛题库含答案 16页

2024年青岛旅游作文 19页

2024年需要努力作文(精选9篇) 11页

2024年雪国狼王读后感850字 5页

2024年“物业管理及公共服务”等知识考试题库.. 39页

车辆买卖合同 10页

2024年雏鹰争章的活动总结 32页

2024年吉林松原前郭县事业单位(含专项)招聘42.. 163页

2024年高校教师岗前培训《高等教育学》题目10.. 24页

河南省高等学校教师岗前培训考试暨教师资格笔.. 22页

2024年“物业管理及公共服务”等知识考试题库.. 39页

2024年《日常生活突发事故急救知识及处理方法.. 33页

2024年中职职业院校(学前教育及幼儿心理学)技.. 41页

2024年事业单位招聘公共基础测验500题【必刷】.. 161页

2024年事业单位招聘公共基础测验500题附答案(.. 164页

2024年事业单位考试《言语理解与表达》题库附.. 172页

2024年事业单位考试常识判断题200道精品【完整.. 79页

2023年四川大学华西口腔医院住院医师规范化培.. 23页

华盛顿公约 4页

小学学霸冲A卷五下语文 96页

最新国家文物局(90)文物字第248号-考古调查、.. 8页

2022年公安机关办理行政案件程序规定题库 56页

精神药物的应用与护理 46页

地藏菩萨本愿经完整版(简体) 47页

全国籍贯代码(身份证6位) 1页