文档介绍:中文摘要
本文针对支持向量机,作了如下几个方面的研究
为了提高支持向量机训练速度,通过对支持向量训练速度慢的主要原因进
行分析,提出了一种预抽取两类样本相对边界的边界向量的方法、
模糊循环迭代算法以及带有样本抛弃方案的支持向量机增量学习算法。以预抽
取的边界向量集合作为初始工作集合,以模糊循环迭代算法对支持向量机进行
训练,根据样本抛弃方案在不丢失分类信息的情况下抛弃部分对分类器没有任
何贡献的样本。其优点是大大提高了支持向量机的训练速度,节约了计算机内
存开销,同时在有增量样本时,能够继承支持向量机以前的训练结果进行增量
学习。为支持向量机在线学习提供了一条有效的途径。
针对目前支持向量机多类分类方法存在的缺点,提出了一种新的支持向量
机多类分类方法。实验结果表明,此方法与目前认为性能好的方
法相比,需要训练的支持向量机数目少,训练速度快,决策速度快,同时克服
了可能出现的不确定分类区域的存在。
针对支持向量机对训练样本内的噪音和孤立点特别敏感、极大地影响了支
持向量机的分类性能的弱点,提出了一种基于密度法的模糊支持向量机,在支
持向量机当中引入样本密度模糊参数,从而消弱了噪音以及孤立点对支持向量
机分类的影响。实验证明,在抗击孤立点和噪音点的干扰方面,优于文献中的
类中心向量方法以及类中心点距离方法,取得了很好的效果。这一方法大大提
高了支持向量机分类的泛化能力,从而大大提高了支持向量机的应用范围。
针对支持向量机函数拟合外插值能力差的缺点,提出了一种三次支持向量
机函数拟合方法,在保持支持向量机很好内插值能力的同时,大大提高了支持
向量机函数拟合的外插值能力,从而提高了支持向量机在训练样本范围外的函
数预测能力。
提出一种基于支持向量机的复杂非线性黑箱系统的模型在线辨识方法,并
将其应用于具有多值函数的基于磁致伸缩的微位移模型的建立以及微位移的
在线预测当中,实验结果表明,和基于神经网络辨识方法相比,本方法
具有更快的训练速度和更好的一步预测精度,具有较强的泛化性能。
关键词支持向量机,增量学习,多类分类,孤立点与噪音点,外插值,辨识
以切叮
氏
,
山
即
田刀
独创性声明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的
研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表
或撰写过的研究成果,也不包含为获得进进选生一或其他教育机构的学位或证
书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中
作了明确的说明并表示了谢意。
学位论文作者签名签字日期少。年了月分日
学位论文版权使用授权书
本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。
特授权生左艺可以将学位论文的全部或部分内容编入有关数据库进行检
索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校
向国家有关部门或机构送交论文的复印件和磁盘。
保密的学位论文在解密后适用本授权说明
学位论文作者签名导师签名和砍
签字日期夕‘年了月了日签字日期年月沙日
第一章绪论
第一章绪论
本章首先阐明了本文所选课题的研究背景,从知识发现的角度出发简要回
顾了机器学习的发展,然后重点介绍支持向量机的研究现状,以及所选课题的
研究价值,最后综述了本文的主要研究工作和创新点。
选题的研究背景和意义
世纪年代以来,随着信息技术和数据库技术的迅猛发展,人们可以
非常方便地获取和存储大量的数据。面对大规模的海量的数据,传统的数据分
析工具如管理信息系统只能进行一些表层的处理如查询、统计学,而
不能获得数据之间的内在关系和隐含的信息。为了摆脱“数据丰富,知识贫乏”
的困境,人们迫切需要一种能够智能地自动地把数据转换成有用信息和知识的
技术和工具,这种对强有力数据分析工具的迫切要求使得知识发现技术应用而
生。
基于数据的机器学习是一种重要的知识发现方法,也是现代智能技术中的
重要内容。其研究从观测数据样本出发寻找规律,利用这些规律对未来数
据或无法观测的数据进行预测。迄今为止,关于机器学习还没有一种被共同接
受的理论框架,关于其实现方法大致可以分为以下三种
第一种是经典的参数统计方法。包括模式识别等在内,现有机器学
习方法共同的重要理论基础之一是统计学。参数方法正是基于传统统计学的,
在这种方法中,参数的相关形式是己知的,训练样本用来估计参数的值。这种
方法