文档介绍:西安电子科技大学
学位论文独创性(或创新性)声明
秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在
导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标
注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成
果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的
材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说
明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切相关责任。
本人签名:___________________ 日期:________________
西安电子科技大学
关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生
在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留
送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,
可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合
学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。
(保密的论文在解密后遵守此规定)
本学位论文属于保密,在年解密后适用本授权书。
本人签名:___________________ 导师签名:________________
日期:___________________ 日期:________________
摘要
支持向量机是建立在统计学****理论基础上的新型机器学****方法,该方法克服
了其它机器算法中存在的局部最小解和过学****问题,有效地提高了算法的推广能
力。由于其完备的理论基础和良好的实验结果,支持向量机在指纹识别、人脸识
别、自动控制设备的故障检测等方面有着广泛的应用。然而,支持向量机作为机
器学****领域中相对比较新的理论,它还有很多方面尚不成熟,需进一步研究和改
进。
本文综述了支持向量机的研究现状,针对目前支持向量机处理不平衡数据时,
分类精度低以及处理大规模数据时的“瓶颈”问题,分别就支持向量机的不平衡
调整以及增量学****方面进行了研究,主要内容如下:
研究了不平衡向量机的算法调整方法。本文针对不平衡数据和噪声点对分类
精度影响的问题,在模糊支持向量机的思想基础上,结合不平衡数据的影响因素,
重新设计了模糊支持向量机的隶属度函数,提出了一种改进的模糊支持向量机。
该方法提高了支持向量机的预测分类精度,平衡了错分率。
研究了不平衡向量机的欠采样方法。本文针对传统欠采样中存在的边界样本
处理策略过于简单、约减样本有限等问题,提出了一种改进的欠采样方法。该欠
采样方法利用多类样本同分类超平面的距离将多类样本集分类,然后使用不同的
采样率对分类样本进行欠采样。该欠采样方法在不增加计算复杂度的前提下,有
效地平衡了样本数据,提高了不平衡数据的分类精度。
研究了支持向量机的增量学****方法。本文将传统的基于 KKT 条件的支持向量
机增量学****算法与 C 均值理论相结合,提出了一种快速的支持向量机增量学****算
法。该算法消除了历史数据和增量数据的冗余信息,提高了学****精度和学****效率。
虽然本文在支持向量机的不平衡问题和增量学****问题上取得了一些进展,然
而,其中涉及到的一些参数需要人工设定,这些都需要进一步的研究和讨论。
关键词:支持向量机统计学****理论不平衡数据欠采样增量学****br/>Abstract
Support vector machine (SVM) is a powerful and novel machine learning approach
developed in the framework of statistical learning theory. It solves the intractable
problems of traditional learning approaches, such as local minima and over-learning etc,
support vector machine has good capacity of generalization. Because of having
self-contained theories and good experimental results, Support vector machines can be
applied in areas such as fingerprint, face recognition, disease detection