文档介绍:惴ㄑ芯考癈软件仿真摘要统计学习理论是一种专门研究小样本情况餮肮媛傻睦本信息在模型的复杂性和学习能力之间寻求最佳折衷,克服了神经删络分类和传统统计分类的许多缺点,具备较高的泛化性能。本文对脑怼⒎掷嗨惴ā⑹迪趾陀τ媒辛松钊氲匮芯浚提出了惴ǖ囊恢諨实现方法,并通过砑抡婧涂7板调试,验证了该方法的可行性。实验结果表明了运算效率的提高,以及在实际系统应用的可行性。论文的主要工作包括:是建立在维,泛化性能和推广能力之上的一种理论,对械南喙馗拍钪С窒蛄亢秃撕辛私樯堋算法的分析和研究:在砺刍≈徊形成了很多惴ǎ泳涞幕痉掷嗨惴ǖ娇樗惴ǎ俚椒纸馑惴ㄒ约坝煞解算法派生出来的各种改进的分解算法,本文重点研究了惴ā疚亩訢的硬件结构和软件开发进行了研究,并对法在系氖迪纸辛嘶咎教帧谥С窒蛄炕幕罢呤侗鹗潜疚牡牧硪桓鲅芯磕谌荩崛”征说话人个性的特征和寻找高效的识别算法是话者识别取得良好性能的关键。本文讨论了利用系数和惴ǖ幕罢呤侗稹关键词模式识别,统计学习理论,珼,说话人识别论。支持向量机墙⒃谕臣蒲袄砺倩≈希萦邢薜难
知识水坝***@pologoogle为您整理
,,.
知识水坝***@pologoogle为您整理
珼琒琒
导师签名:枇日期:⒗趔生延爿坠本人签名:主堕生坠日期:丝堑躩声、明保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密独创性虼葱滦声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑论文注释:本学位论文不属于保密范围,适用本授权书。日期:
第一章绪论统计学习理论和支持向量机基于数据的机器学习是现代智能技术的重要方面,其研究实质是从观测数据出发寻找规律谜庑┕媛啥晕蠢词莼蛭薹ü鄄獾氖萁性げ狻O钟谢学习共同的重要理论基础之一是统计学。传统统计学研究的是样本数目趋于无穷大时的渐进理论,现有学习方法也多是基于此假设,并在某些领域取得了一定的进展,提出了一些新的概念和学习方法。但在实际问题中,样本数往往是有限的且又不知道数据内存的相关性,因此传统的机器学习方法常常导致了病态的训练结果,在实际应用中表现不尽人意。这正是统计学习理论及支持向量机越来越受到重视的主要原因。,在高维情况下,传统的机器学习方法往往难以表现出良好性能。如神经网络分类方法,。原因在于:神经网络的解易陷于局部极值,在高维空间中可能存在很多的局部极值,不同的局部极值之间有很大差异,因此神经网络的解必然呈现随机性。其次,维数越高,样本数目也越多。在高维空问中,为了能像在低维空间中那样描述整个样本空间,所需样本数呈指数增长。另外,特征空间的维数越高,传统的机器学习方法的运算量就越大,从而使训练时间和测试时间也越长。另一方面,在算法精度上,支持向量机方法已经超过传统的机器学习方法或与之不相上下。例如,对于美困邮政标准手写数字识别问题,精心构造的五层神经网络姆掷嗾仿蚀飅%,是传统方法中识别性能最好的,但目前支持向量机方法的分类正确率己达到%,与传统方法相比,具有较好的效果。还有⋯方面,传统方法难以确定学习机器结构。由于许多传统方法缺乏普遍适用的指导原则,很多实现细节都要由所要解决的问题本身和研究人员的经验来决定,成功经验很难被借鉴。例如,对于前向多层感知器,其隐层节点的选择就是个难题。隐层节点的选择直接影响网络的性能。若隐层节点过少,则会导致学习不足,难以进行正确分类。若隐层节点过多,则网络参数越多网络越复杂,可能使网络的泛化能力渤莆M乒隳芰Γ侵妇盗泛蟮姆掷嗥鞫晕丛谘祃练样本集中出现的样本作出正确判断的能力睢传统的模式识别方法都是在样本数趋于无穷大时得到最佳的识别性能效果。北京邮电大学硕士学位论文
变差。因此,有限样本绕涫切⊙情况下的机器学习问题成为机器学习理它仍然是建立在经验风险最小化原则基础之上,即:以训练的平均误差为最小的实质性