1 / 11
文档名称:

后验支持向量机学习报告.doc

格式:doc   大小:83KB   页数:11页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

后验支持向量机学习报告.doc

上传人:yixingmaoh 2019/7/28 文件大小:83 KB

下载得到文件列表

后验支持向量机学习报告.doc

文档介绍

文档介绍:后验支持向量机学习报告1后验支持向量机支持向量机(SVM)是在由Vapnik等人发展的统计学习理论基础上发展起来的一类学习算法,通过对线性可分训练集按类间最大间隔设计分类器的方法来达到较好的推广能力。对于非线性可分的数据集引入了松弛变量来控制样本的误分率构造线性分类器,利用核方法推广线性分类器为非线性分类器。SVM能够较好的泛化能力,在许多问题上表现得很好,于是对SVM的研究受到人们很大的关注,同时SVM的使用也越来越广泛,但SVM仅能给出分类结果,而不能给出确切的各类的概率,而在很多应用场合中,人们不仅关注分类的结果,更关注分为各类的概率。如银行的信用欺诈检测,银行不仅想知道哪些人存在欺诈的可能,更希望能知道每个人欺诈的概率,这样有助于银行做出更好地决策。贝叶斯分类器虽然能提供各类的后验概率,但贝叶斯分类器需要预先知道类条件概率密度,通常在实际问题中这是无法获取的。Vapnik提出一种将SVM的离散输出映射为概率的方法,Wahha研究再生核Hilbert空间的表示定理,应用到统计学习理论和SVM中。Platt等提出一种将支持向量机决策函数的输出映射为类后验概率的算法(PPSVM),这是本次学习的主要内容。2后验支持向量机PPSVMPlatt提出PPSVM,主要思想是用拟合一个后验概率的参数模型,将标准SVM的输出结果映射为后验概率。设SVM的输入为,其中,误差函数:,Platt的主要工作就是找到Sigmoid函数用于近似支持向量机的后验概率,Sigmoid函数转换形式如下:其中,f为标准SVM的输出结果,表示在输出值f的条件下分类正确的概率。A和B是需要估计的参数值,其优化策略可以通过解最大似然问题来解决:其中,l为样本的数量,和分别是正类和负类样本的数量。 这种参数估计方法会出现一些问题,分别是Sigmoid函数训练集的选择和如何避免拟合出错。最早训练Sigmoid函数所用的训练集是简单的和训练SVM共用训练集,但是这种方法容易f的估计造成偏差,对于非线性SVM这种偏差甚至是灾难性的。有两种方法可以较好解决这一问题,一是将训练集保留一部分(通常是30%)用来训练Sigmoid函数,这就使训练SVM和训练Sigmoid函数的训练集分开,就不存在训练Sigmoid的样本中有支持向量造成Sigmoid函数的参数估计的不准确。第二种是采用交叉验证的方法,在三折交叉验证中,将训练集分为三部分,其中每次用其中的两份来训练SVM,另一份用来估计。用交叉验证的方法可以使Sigmoid函数的训练集变大,而且能够给出一个更小的A和B的估计方差。当数据集是一个非平衡数据集时,会出现Sigmoid函数的拟合出错,当样本只有少数正类而且与负类线性可分时,最大似然方法仍然简单地将A设为一个很大的负数,这可能会造成估计结果中出现无穷量,通过对添加扰动可以避免这种情况出现,具体的做法是。3PPSVM实现我在matlab平台上对Platt的理论进行了实现,并进行实现。实验所使用的数据集是使用贝叶斯网络生成的数据,该数据集有共有4000个样本,3个离散属性。使用的是草地是否潮湿的模型,模型结构如下:对数据集采用实则交叉验证,%,%,实验结果显示使用PPSVM所取得的效果和单独使用SVM所取得的结果在准确率上相差不大,但使用PPSVM可以获得一个后验概率,这是Platt的最大贡献。附录附录1Sigmoid函数算法代码matlab实现function[A,B]=Sigmoid_E(out,target,prior1,prior0)A=0;B=log((prior0+1)/(prior1+1));hiTarget=(prior1+1)/(prior1+2);loTarget=1/(prior0+2);lambda=10^(-3);olderr=10^30;[m,n]=size(target);pp=(prior1+1)/(prior1+prior0+2)*ones(m,n);count=0;forit=1:100a=0;b=0;c=0;d=0;e=0;fori=1:nif(target(i)==1)t=hiTarget;elset=loTarget;endd1=pp(i)-t;d2=pp(i)*(1-pp(i));a=a+out(i)*out(i)*d2;b=b+d2;c=c+out(i)*d2;d=d+out(i)*d1;e=e+d1;endif(abs(d)<10^(-9)&&abs(e)<10^(-9))break;endoldA=A;oldB=B;while(1)det=(a+lambda)*(b+lambda)-c*c;if(det==0)lambda=lambda*10;conti

最近更新

大学生上闲鱼项目融资方案 6页

企业质量体系各种管理规范 105页

山东省莱州市一中2022-2023学年高考物理考前最.. 15页

山西平遥县和诚2023年生物高一第一学期期末复.. 5页

广东揭阳市惠来县第一中学2022-2023学年高三压.. 14页

广东省肇庆市端州区南国中学英文校2023届中考.. 24页

广西桂林市全州县2023届中考联考英语试卷含答.. 11页

外卖大闸蟹项目融资方案 6页

江苏省淮安市四校2023年高考仿真模拟英语试卷.. 14页

江苏省靖江外国语校2022-2023学年中考生物最后.. 20页

江西省赣州市宁都县重点名校2023届中考化学考.. 10页

河南省濮阳市台前县重点中学2022-2023学年中考.. 23页

浙江省杭州十四中2023年高三第六次模拟考试物.. 14页

湖北省麻城思源实验校2023届中考化学模拟预测.. 12页

湖南省邵阳市郊区2023年中考化学考前最后一卷.. 14页

福建省德化县2023年中考语文押题试卷含解析 14页

衡阳市重点中学2022-2023学年中考生物考前最后.. 13页

化工原理考研09整理资料 74页

重庆市綦江区2023届中考物理猜题卷含解析 13页

陕西省西安市西电附中2022-2023学年高三第四次.. 14页

黑龙江省鹤岗市工农区鹤岗一中2022-2023学年高.. 14页

培训机构经费预算方案 7页

培训教室实施方案 6页

物业管理概述 87页

阿里巴巴招聘与面试技巧 71页

高二政治教师工作计划范例(精选4篇) 7页

高一语文文言文原文及翻译(精选2篇) 5页

领导辞职报告(通用5篇) 11页

难忘春节作文(通用3篇) 4页

银行辞职报告(精选11篇) 14页