文档介绍:东南大学
硕士学位论文
基于高斯混合模型的与文本无关的说话人识别算法的改进
姓名:金鑫
申请学位级别:硕士
专业:信号与信息处理
指导教师:赵力
20100307
摘要基于高斯混合模型的与文本无关的说话人识别算法的改进导师姓名:赵力教授东南大学信息科学与工程学院析语音信号来识别说话人成为可能,说话人识别具有广泛的应用前景。本文主要训练码书的传统的惴ɑ∩嫌τ昧W尤河呕惴中的迭代公式产生新的解雌康穆胧,对该新解利用惴ń杏呕优化后得到的结果再输入到惴ㄖ胁陆猓钡讲愎缓玫穆胧槲V埂关键词:语音信号处理,说话人识别,矢量量化,粒子群优化算法,高斯混合模学生姓名:金鑫语音是人的自然属性,每个人的语音都带有强烈的个人色彩,这使得通过分讨论了说话人识别的特征参数提取、说话人识别系统组成、基于矢量量化,乃祷叭耸侗鸱椒ḿ捌涓慕椒ā⒒诟咚够旌夏P珿乃祷叭耸侗鸱椒ḿ捌涓慕椒ǎ⒍允笛榻峁辛颂论。为了与惴ǖ氖侗鸾峁卸员龋疚氖紫榷訴椒ㄗ髁颂致郏,进行改进,得到甃算法。另外,ú跏悸胧椋缓蟾軵算法瓽方法是根据语音帧能量对语音数据进行分类,在抗噪性能方面有着明显的优势,并且在信噪比较低的情况下系统的鲁棒性较好;椒ㄔ谔征空间对语音数据进行分类,描述说话人个性特征的信息比较丰富,在信噪比较高的时候系统的识别率很高,但是缺点是在信噪比低的时候系统鲁棒性得不到保证。型
东南大学硕士学位论文Ⅱ
甅,,,,疭甋’甶,,—甈,甃.,.:,—
东南大学硕士学位论文
第一章绪论语音的概念以及说话人识别的研究背景说话人识别的概念以及分类语言是人类特有的用来表达意思、交流思想的工具,是一类特殊的社会现象。别发展到复杂环境下对大量说话人的识别。所采用的识别技术从仅涉及动态规划语音则是语言的声学表现,具有明显的个体差异【俊S镆羰侨说淖匀皇粜灾唬由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈地个人色彩,这使得通过分析语音信号来识别和说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有特征,不会丢失或遗忘:语音信号的采集方便,系统设备成本低:另外利用电话网络还可以实现远程客户服务等等。而且近年来说话人识别在相当广泛的领域内已经发挥出重要的作用。如安全保卫领域缁艹∷朊趴刂、公安司法领域缱锓讣嗵爰别⒕铝煊如战场环境指挥员鉴别⒉凭煊如自动转账与出纳等信息服务领域缱远畔⒓焖骰虻缱由涛等等。正因为如此,说话人识别具有广泛的应用前景,近年来越来越受到人们的重视【俊对说话人识别的研究始于世纪年代。早期的工作主要集中在入耳听辨实验和探讨听音识别的可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨【¨。实验室的瓽媚渴庸鄄煊锲淄嫉姆椒ń行识别,提出了”声纹”母拍睢4撕螅孀诺缱蛹际鹾图扑慊际的发展,说话人识别的研究取得了突飞猛进的发展,动态规划、线性预测、矢量量化、隐马尔科夫模型等技术先后成功应用于说话人识别。识别的模型从单模板模型发展到多模板模型,从多模板模型发展到模型、高斯混合模型、隐马尔科夫模型,再到人工神经网络模型。识别环境从无噪声环境下对少数说话人的识发展到涉及统计信号处理、矢量量化与编码、模糊系统理论与方法、最优估计理论、人工神经网络、灰色系统分析等多科学领域【蟆说话人识别,是从说话人的一段语音中分析和提取出说话人的个性特征,自
说话人识别的基本方法说话人识别的研究现状随着社会、军事以及安全等领域需求的增长,美国、日本、;年甋.】采用蛊撞问闞康热瞬捎昧薓倒谱,人于年将分形维数与差分蛊撞问嘟岷暇〉昧撕芎玫男Ч动确定说话人是否在所登记的说话人的集合中,以及说话的人是谁的过程【说话人识别包括两个方向,即说话人辨认系统和说话人确认系统。不论是辨认还是确认,说话人识别都可以分为与文本有关和与文本无关的两种方式。“与文本有关”方式就是指说话人按照给定的文本或提示发音,“与文本无关”方式是指无论说话人说什么都进行识别。“与文本无关”的识别方式难度很大,目前在实用性上还有很大一段距离。实用的系统多为“与文本有关”的方式,例如要求说话人常用的关键语句。说话人识别的系统包括训练和识别两个阶段【。在说话人辨认系统中,需要将测试参数与所有的参考参数进行比较,并将测试人辨认为是与其参数距离最小的参考参数所对应的使用者。而在说话人确认中,只要将测试参数与所声称的说话人参数进行比较,如果距离小于事先规定的阈值,则予以确认,否则进行拒绝。由此可以看出,确认系统除了比辨认系统多了个身份声明部分,以及判决准则有所区别外,两者没有本质的区