文档介绍:摘要的主要技术,从特征参数的获取到各种识别方法的应用,重点介绍了矢莓量化和高斯混合模型街只谀0宓氖侗鸱椒ā2⑹迪至艘桓鲋饕;赩乃祷叭耸侗鹣低常诒占馐灾在方法的训练中,提出了一只≈鸬闼阉鞯母慕腖算法,较好地解决了传统算法在迭代过程中会产生空胞腔、无法适用于多种距离测度等问题。并设计恢侄訴炕蟛进行规格化处理的方法,使规格化后的量化误差更加适台对说话人进行判决。对椒ǖ目蚣芙辛顺醪降难芯浚⒍訣惴ㄖ械踔档难《ā⒎讲畹南薅ḿ澳P馄合数对识别结果的影响进行了’ǔ潭鹊奶致邸在预处理方面,提出了一种基丁基音轮廓抖动的去除语音中噪音段和静音段的方法,取得了很好的实际效果。最终的识别系统针对的单声道语音,采用了阶的线性预测系数、阶的线性预测倒谱系数以及基音参数构建了一个主要采用方法的说话人识别系统,在个说话人的闭集测试中取得了接近ァU飧鱿低潮唤徊嚼┱沟皆诙嗳硕曰俺【跋碌淖远侄嗡祷叭耸踩〉昧关键词:说话人识别矢量量化高斯混合模型惴‥惴ㄈピ肷椒说话人识别的研究始丁世纪年代,有着极为广阔的应用前景。本文分析了说话人识别中取得了较好的效果。一定的识别效果。
知识水坝***@pologoogle为您整理
,琺,,甌,,,甦瑃甌...猺痵琤甌
知识水坝***@pologoogle为您整理
导师签名:墨亟鱼日期:研究生签名:‘亟二逮::妾:建期:—.导师签名:/∥东南大学学位论文独创性声明东南大学学位论文使用授权声明研究生签名:期:本人声明所呈交的学位论文是我个人在导师指导卜进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的、兑明并表示了谢意。日东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阆,可以公布ǹ论文的全部或部分内容。论文的公布ǹ授权东南大学研究生院办理。.
第一章绪论课题研究背景说话人识别技术的主要方法及其发展概况随着计算机技术的发展,人们越来越不满足于传统的依赖于键盘和鼠标的人机交互方式,而希望计算机提供一个更加友好的界面,使我们以自己更为习惯的交流方式来实现人机交互。我们希望计算机能够理解和判断人在日常生活中所发出的自然信息,这些信息包括视觉上,触觉吞跎的。视觉上,我们希望计算机可以读懂人的表情和动作,做出相应的反应;触觉上,目前广泛使用的触摸屏是一个不错的例子。而听觉上,我们希望计算机可以理解我们的自然语言。自然语言所传递的信息包括说话的内容、说话的人以及说话时的情绪等等。本文将主要研究计说话人识别又可以分说话人鉴别,两种模式。侵付砸欢斡镆簦芯鍪欠袷悄承└行巳さ乃祷叭酥械囊个所发出;蛑付砸欢斡镆簦镆舻姆⒊稣咭丫髯约菏悄橙耍孟低忱磁芯稣嫖薄?梢钥出两者的区别在于呐卸ǚ段撬懈行巳さ乃祷叭耍且桓黾希鳤的判定范围则集中到一个人,即被声明的那个人。显然,要达到同样的识别准确率,氖迪帜讯纫3鼳。而蚩梢钥闯葾在判定范围集合人小为钡囊桓鎏乩N业穆畚墓ぷ鹘ü菇ㄒ桓鯝系何限制。显然,后者更具一般性,在实现难度上也更大。本次课题构建的系统所选择的正是这种更具一般性的特定内容的模拟语音在被计算机识别之前,首先要进行数字化。这就牵涉到采样率和采样精度的问题,构建的低趁嫦虻氖遣裳饰线性采样精度,单声道的数字语音。这种配置符合电话信道中单路语音的配置,具有广泛的适用性;更高采样率、采样精度和提供更多声道数的数字语音将提供比当前配置更多的信息,因此容易在当前系统中加以扩展。说话人识别有着广阔的市场应用前景,如安全系统的语音开启,公安系统的语音验证,电话网让计算机来“熟悉”这个说话人的声音。对多个说话人识别系统,就要提供~组这样的语音样本。算机对说话人的识别,即自动说话人识别,和说话人验证统,可以基于这一系统,方便地实现就低趁姿担挚梢苑治L囟谌—的敕翘囟谌的G罢咭G蟠媸度怂抵付谌莸囊欢位袄唇惺侗穑笳咴蚨源媸度说乃祷澳谌菸奕络上的呼叫者自动辨认等,在互联网上则可应用于信息监测、语音邮件,电子商务,信息服务、远程登陆等诸多领域。在日常生活中,我们要依靠听觉识别一个人的声音,必须事先要对这个人的声音足够熟悉。对计算机来说也是一样,任何说话人识别的方法都是先为计算机提供足够的特定说话人的语音样本,瓵
分别与这些模板进行比对,判决是否和某个模板匹配,或是和任何模板都不匹配,从而对说话人做⋯判决。这个过程可以用图来表示。其中,蛭Q盗返目蛲迹低骋J侗餘个特定人的语音,便要事九对这鋈说挠镆艚蟹直训罚玫礁髯缘哪0濉圈为识别的框图