文档介绍:兰州理工大学
硕士学位论文
SVM在参数选择上的优化
姓名:王静
申请学位级别:硕士
专业:计算机应用技术
指导教师:余冬梅;赵付青
20080320
摘要模型的最大泛化能力,因此与建立在经验风险最小原则上的神经网络模型相比,支持向量机是一个具有多类分类能力的非线性分类器。在实际应用中,有可能出现不同类别样本数目相差很大的情况,比如在解决故障检测等分类问题时,猻训练的分类错误总偏向于样本数较少的类别,因而影响了分类的精确性。为提高精确性,提出了一种优化算法,在训练过程中针对不同类样本,采用不同的权值来优化训练过程,按正负类样本在总样本中所占的比例,加大样本数较少的类别权值,降低样本数较大的类别权值来实现两类样本间的均衡。实验结果表明该方法对两类样本数目相差很大的问题是有效的。支持向量机的参数对于分类精确性影响很大,到目前为止,还没有明确的选择参数的算法。本论文运用支持向量机建立模式识别分类器模型,研究影响模型分类能力的相关参数,在分析参数对分类器识别精度的影响基础上,提出了用遗传算法建立支持向量机分类器模型的参数自适应优化算法,试验结果表明本文所建立在统计学习理论和结构风险最小原则上的支持向量机在理论上保证了理论上更为完善。提算法的正确性及有效性。关键词:支持向量机;模式识别;遗传算法;分类器;优化;硕士学位论文
,甋畒甋觫鲈诓问≡裆系挠呕籵艳篠;甮甀,,.瓵甧甀痵痵丘’.畂瓵,;,,Ⅱ
插图索引图最优分类面⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯图支持向量机示意图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图染色体结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯硕士学位论文Ⅲ
附表索引数值实验结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.惩罚因子苑掷嗑ǘ鹊挠跋臁高斯核函数的仃值对分类精度的影响⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..基于遗传算法的支持向量机的参数选择及计算结果⋯⋯⋯⋯⋯表鰒诓问≡裆系挠呕
日期:嘶滤辍H王静导师签名:多莎≮破缶兰州理工大学学位论文原创性声明和使用授权说明日期:沙谐年亍月谌日期:夕晗υ翷日原创性声明学位论文版权使用授权书本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。
第滦髀研究背景与意义基于数据的机器学习是现代智能技术中的重要方面,研究从观测数据识别、神经网络等在内,现有机器学习方法共同的重要理论基础之一是统计学。传统统计学研究的是样本数目趋于无穷大时的渐近理论,现有学习方法也多是基于此假设。但在实际问题中,样本数往往是有限的,因此一些理论上很优秀的学习方法实际中表现却可能不尽人意。与传统统计学相比,统计学习理论或是一种专门研究小样本情况下机器学习规律的理论。甐热舜恿⑵呤甏J贾铝τ诖朔矫嫜芯縩骄攀甏中期,随着其理论的不断发展和成熟,也由于神经网络等学习方法在理论上缺乏统计学习理论是建立在一套较坚实的理论基础之上的,为解决有限样本学习问题提供了一个统一的框架。它能将很多现有方法纳入其中,有望帮助解决许多原来难以解决的问题热缟窬缃峁寡≡裎侍狻⒕植考〉阄侍獾;同时,在这一理论基础上发展了一种新的通用学习方法一支持向量机騭С窒蛄炕莄晔紫忍岢隼吹模墙昀机器学习研究的一项重大成果。它已初步表现出很多优于已有方法的性能。一些学者认为,蛃正在成为继神经网络研究之后新的研究热点,并将有力地推动机器学习理论和技术的发展。我国早在八十年代末就有学者注意到统计学习理论的基础成果,但之后较少研究,目前又有部分学者认识到这个重要的研究方向。虽然诶砺凵嫌泻芡怀龅挠攀疲肫淅砺垩芯肯啾龋τ醚芯可邢喽比较滞后,目前只有比较有限的实验研究报道,且多属仿真和对比实验。当前对难芯糠叫宋窗艿睦此抵饕N屏礁龇矫妫阂皇峭ü詓本身性质的研究,提出进一步完善的措施,此外还包括多类识别问题和快速训练算法等。二是不断探索新的应用领域,局噬鲜且恢址窍咝允荽砉ぞ撸嗣亲⒁獾剿在数字信号处理、图像处理、智能控制等领域有巨大的应用潜力,这方面己经有了一些结果,但是在数据挖掘等方面还可以做进一