1 / 60
文档名称:

利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究(可复制论文).pdf

格式:pdf   页数:60
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究(可复制论文).pdf

上传人:mkt365 2013/11/12 文件大小:0 KB

下载得到文件列表

利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究(可复制论文).pdf

文档介绍

文档介绍:因素。本文从帧似然概率的统计特性出发,提出了一种非线性变换方法~指数摘要利用矢量量化和混合高斯模型乃祷叭耸侗鸬难芯硕士研究生王吉林导师赵力教授说话人识别始于世纪年代,从世纪年代开始日益成为当今的一多的工作者投身于这一一领域的研究中,使得说话人识别方面出现巨大发展。但它本课题以语音信号的蛊紫凳钪档蛊紫凳糁芷诤筒钪祷糁期的混合特征参数作为识别的特征矢量集,运用矢量量化技术实现与文本单音节语音的平均识别率达到了%,双音节语音的平均识别率达到了,%,无关说话人识别的模型,而环境与个性特征的变化是影响采用识别率的重要归一化变换。理论推导和实验结果表明,该变换能够提高识别率。人识别、识别方法的优化及系统实现与实验结果这几个方面讨论了说话人识别的关键字:说话入识别:矢量量化;混合高斯模型;蛊紫凳恢甘橐东南大学无线电工程系个研究热点。说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域。正因为说话入识别具有如此广阔的应用前景,国内外许许多还远远没有成熟。有关的说话人识别。在一个人,个的语音库上进行了系统的识别实验,四音节语音的识别率达到了.%,说话人识别的实时识别率达到了%以上,达到了较为满意的识别效果。在矢量量化中引入模糊聚类算法,实现了对硬聚类算法的有效扩展,提高了码本的量化精度。混合高斯模型亲钣诺挠胛谋本篇论文从常用语音特征参量的提取、基于矢量量化和混合高斯模型的说话应用技术,并对实验结果进行了讨论。化变换
知识水坝***@pologoogle为您整理
篧籚籊;猟甒瑃,,,,琒篫琒,.%%%畐瑆甌甀:.%’瑂,,,瓾,琣猻瑂琤血’,Ⅱ
知识水坝***@pologoogle为您整理
导师签名:丝§杰£叠建丝东南大学学位论文独创性声明期:丝东南大学学位论文使用授权声明研究生签名:日期:少∥。,除了文中特以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。刊登畚牡娜ú炕虿糠帜谌荨B畚牡墓ú包括刊登谌ǘ洗笱а芯可喊炖怼
第一章绪论说话人识别的基本概念的个人色彩。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固缯匠』肪臣嗵爸富釉奔、财经领域缱远U擞氤瞿傻、信息服务领域缱远畔⒓焖骰虻缱由涛等等。这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。说话信号中的语义内容,并不考虑说话人的个性,强调的是语音的共性。说话人识别系统的结构框图,它由预处理、特征提取、模式匹配和判决等几大部分组成。除此之外,完整的说话人识别系统还应包括模型训练和判决闽值选择等部分。建立和应用一个说话人识别系统可分为两个阶段,即训练⒉阶段和识别阶段。在训练阶段,系统的每一个使用者说出若干训练语料,系统根据这些训练语料,通过训练学习建立每个使用者的模板或模型参数参考集。而在识别阶自动说话人识别一个既有巨大吸引力而又有相当难度的课题。语音是人的自然属性之一,由于各说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈有特征,不会丢失或遗忘;语音信号的采集方便,系统设备成本低:另外利用电话网络还可实现远程客户服务等等。因此说话人识别具有广泛的应用前景,如保安领域缁艹∷朊趴刂、公安司法领域缱锓讣嗵爰、军事领域说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对人识别不同于语音识别,前者利用的是语音信号中说话人的个性特征,不考虑包含在语音中的字词的含义,强调的是说话人的个性;而后者的目的是识别出语音图猯是说话人识别系统的框图,说话人识别主要由以下几部分组成:段,把从待识别说话人说出的语音信号中提取的特征参数,与在训练过程中得到篈芫靡岳淳褪图籭说话人识别系坑框图
的参考参量集或模型模板加以比较,并且根据一定的相似性准则进行判定;对于说话人辨认来说,所提取的参数要与训练过程中的每一人的参考模型加以比较,并把与它距离最近的那个参考模型所对应的使用者辨认为是发出输入语音的说话人。对于说话人确认而言,则是将从输入语音中导出的特征参数与其声音为某人的参考量相比较,如果两者的距离小于规定的阀值,则予以确认,否则予以拒预处理包括对语音数据进行端点检测、预加重、加窗、分帧等。在说话人识别系统中特征提取是最重要的一环,特征提取就是从说话人的语音信号中提取出表示说话人