文档名称：

基于支持向量机的数据挖掘方法.pdf

格式：pdf 页数：62页

下载后只包含 1 个 PDF 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

基于支持向量机的数据挖掘方法.pdf

上传人:799474576 2015/11/2 文件大小：0 KB

下载得到文件列表

基于支持向量机的数据挖掘方法.pdf

相关文档

文档介绍

文档介绍：山东大学硕士学位论文摘要定义的距离来发现野点,。在第五章支持向量机是基于统计学****理论的新一代机器学****技术。由于使用结构风险最小化原则代替经验风险最小化原则,使它能较好地处理小样本情况下的学****问题。又由于采用了核函数思想,使它能把非线性问题转化为线性问题来解决并降低了算法的复杂度。目前,支持向量机已经成为国际上机器学****领域新的研究热点。本论文首先概要介绍了支持向量机的理论背景,结合目前一些主要的支持向量机方法进行深入研究,提出新的见解。本论文的主要贡献可归纳为如下三个方面:驹び潘惴ㄑ芯论文首先介绍了一种可以减少大规模支持向量机训练时间和能减少野点影响的方法。很多支持向量机的算法都是从一个随机的训练数据的子集出发开始训练,本论文提出一种新的方法,在高维空间中估计出那些可能最终成为支持向量的向量集合,。但是由于分类面只依赖于少量的支持向量,所以易受噪声数据影响。针对这种情况,本文提出了高维中心支持向量机椒ā8梅椒ɡ梅窍咝钥煞质萦成涞礁呶线性可分的特性,把数据映射到高维特征空间,将高维中心之间的距离最小作为优化的原问题。仿真实验表明,,笔者深入分析了支持向量集的特性,介绍了一般的增量学****算法。通过分析,指出在增量学****中确定学****参数比较困难,所以本文利用甋第
方法提出一种支持向量机的增量学****策略,可以自动的调整增量训练参数。同时研究发现可能由于数据分布的不同,下一批数据的经验误差远大于原来的支持向量的,导致原有的支持向量在增量学****中对最终的分类结果影响很小,所以在新的训练过程中要加大对原有支持向量的惩罚,以提高最终分离器的精度。最后我们给出了此方法的原始优化问题、拉格朗日函数和对偶问题。文章的最后,笔者总结全文,指出了有待于进一步解决的问题,并对支持向量机理论的发展前景做出了展望。关键词:支持向量机;模式分类;增量算法;统计学****理论;邻域算法第
,瑃瓸瓼甋甌猻..琣第Ⅲ页
;瓾甌.,,篠籌第页
论文作者签名:趔:导师签名,趣日期:塑牡论文作者签名:壶幽:日期:丝翻原创性声明关于学位论文使用授权的声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人本人完全了解山东大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。C苈畚脑诮饷芎笥ψ袷卮斯娑附件一:承担。
山东大学硕士学位论文第一章绪论课题背景数据挖掘,简称侵J斗⑾,简称的核心环节,就是从大量的、不完全的、有噪声的,模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是涉及机器学****模式识别、统计学、人工智能、数据库管理及数据可视化等学科的边缘学科。用统计的观点看,它可以看成是通过计算机对大量的复杂数据集的自动探索性分析。数据挖掘面对的是经初步加工的数据,更专注于知识发现。近年来出现的数据挖掘技术之所以被认为具有令人兴奋的研究前景,是因为它能够获得广泛的应用,如用于关键性决策,重要策略的制定等。海量数据的出现,对数据挖掘应用形成极大的需求,】;预测的准确率:涉及模型正确的预测新的或者先前未见过的数据的类标号的能力。速度:涉及产生和使用模型的计算花费。强壮性:涉及给定噪声数据或者具有空缺值的数据,模型正确预测可伸缩性:涉及给定大量数据,有效地构造模型的能力。可解释性:,,然后指出支持向量机方法的优点,并和神经网络分类方法作了简单的比较,在总体上表明了支持向量机方法在数据挖掘分类方法中的地位。的能力。第·
山东大学硕士学位论文数据挖掘的任务根据发现知识的不同