1 / 75
文档名称:

基于VQ与GMM的说话人识别(可复制论文).pdf

格式:pdf   页数:75
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于VQ与GMM的说话人识别(可复制论文).pdf

上传人:mkt365 2013/11/11 文件大小:0 KB

下载得到文件列表

基于VQ与GMM的说话人识别(可复制论文).pdf

文档介绍

文档介绍:摘要的主要技术,从特征参数的获取到各种识别方法的应用,重点介绍了矢莓量化和高斯混合模型街只谀0宓氖侗鸱椒ā2⑹迪至艘桓鲋饕;赩乃祷叭耸侗鹣低常诒占馐灾在方法的训练中,提出了一只≈鸬闼阉鞯母慕腖算法,较好地解决了传统算法在迭代过程中会产生空胞腔、无法适用于多种距离测度等问题。并设计恢侄訴炕蟛进行规格化处理的方法,使规格化后的量化误差更加适台对说话人进行判决。对椒ǖ目蚣芙辛顺醪降难芯浚⒍訣惴ㄖ械踔档难《ā⒎讲畹南薅ḿ澳P馄合数对识别结果的影响进行了’ǔ潭鹊奶致邸在预处理方面,提出了一种基丁基音轮廓抖动的去除语音中噪音段和静音段的方法,取得了很好的实际效果。最终的识别系统针对的单声道语音,采用了阶的线性预测系数、阶的线性预测倒谱系数以及基音参数构建了一个主要采用方法的说话人识别系统,在个说话人的闭集测试中取得了接近ァU飧鱿低潮唤徊嚼┱沟皆诙嗳硕曰俺【跋碌淖远侄嗡祷叭耸踩〉昧关键词:说话人识别矢量量化高斯混合模型惴‥惴ㄈピ肷椒说话人识别的研究始丁世纪年代,有着极为广阔的应用前景。本文分析了说话人识别中取得了较好的效果。一定的识别效果。
知识水坝***@pologoogle为您整理
,琺,,甌,,,甦瑃甌...猺痵琤甌
知识水坝***@pologoogle为您整理
导师签名:墨亟鱼日期:研究生签名:‘亟二逮::妾:建期:—.导师签名:/∥东南大学学位论文独创性声明东南大学学位论文使用授权声明研究生签名:期:本人声明所呈交的学位论文是我个人在导师指导卜进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的、兑明并表示了谢意。日东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阆,可以公布ǹ论文的全部或部分内容。论文的公布ǹ授权东南大学研究生院办理。.
第一章绪论课题研究背景说话人识别技术的主要方法及其发展概况随着计算机技术的发展,人们越来越不满足于传统的依赖于键盘和鼠标的人机交互方式,而希望计算机提供一个更加友好的界面,使我们以自己更为习惯的交流方式来实现人机交互。我们希望计算机能够理解和判断人在日常生活中所发出的自然信息,这些信息包括视觉上,触觉吞跎的。视觉上,我们希望计算机可以读懂人的表情和动作,做出相应的反应;触觉上,目前广泛使用的触摸屏是一个不错的例子。而听觉上,我们希望计算机可以理解我们的自然语言。自然语言所传递的信息包括说话的内容、说话的人以及说话时的情绪等等。本文将主要研究计说话人识别又可以分说话人鉴别,两种模式。侵付砸欢斡镆簦芯鍪欠袷悄承└行巳さ乃祷叭酥械囊个所发出;蛑付砸欢斡镆簦镆舻姆⒊稣咭丫髯约菏悄橙耍孟低忱磁芯稣嫖薄?梢钥出两者的区别在于呐卸ǚ段撬懈行巳さ乃祷叭耍且桓黾希鳤的判定范围则集中到一个人,即被声明的那个人。显然,要达到同样的识别准确率,氖迪帜讯纫3鼳。而蚩梢钥闯葾在判定范围集合人小为钡囊桓鎏乩N业穆畚墓ぷ鹘ü菇ㄒ桓鯝系何限制。显然,后者更具一般性,在实现难度上也更大。本次课题构建的系统所选择的正是这种更具一般性的特定内容的模拟语音在被计算机识别之前,首先要进行数字化。这就牵涉到采样率和采样精度的问题,构建的低趁嫦虻氖遣裳饰线性采样精度,单声道的数字语音。这种配置符合电话信道中单路语音的配置,具有广泛的适用性;更高采样率、采样精度和提供更多声道数的数字语音将提供比当前配置更多的信息,因此容易在当前系统中加以扩展。说话人识别有着广阔的市场应用前景,如安全系统的语音开启,公安系统的语音验证,电话网让计算机来“熟悉”这个说话人的声音。对多个说话人识别系统,就要提供~组这样的语音样本。算机对说话人的识别,即自动说话人识别,和说话人验证统,可以基于这一系统,方便地实现就低趁姿担挚梢苑治L囟谌—的敕翘囟谌的G罢咭G蟠媸度怂抵付谌莸囊欢位袄唇惺侗穑笳咴蚨源媸度说乃祷澳谌菸奕络上的呼叫者自动辨认等,在互联网上则可应用于信息监测、语音邮件,电子商务,信息服务、远程登陆等诸多领域。在日常生活中,我们要依靠听觉识别一个人的声音,必须事先要对这个人的声音足够熟悉。对计算机来说也是一样,任何说话人识别的方法都是先为计算机提供足够的特定说话人的语音样本,瓵
分别与这些模板进行比对,判决是否和某个模板匹配,或是和任何模板都不匹配,从而对说话人做⋯判决。这个过程可以用图来表示。其中,蛭Q盗返目蛲迹低骋J侗餘个特定人的语音,便要事九对这鋈说挠镆艚蟹直训罚玫礁髯缘哪0濉圈为识别的框图

最近更新

最新全国政法队伍教育整顿知识竞赛试题库及参.. 40页

最新全国政法队伍教育整顿知识竞赛试题库附参.. 40页

最新煤气操作证考试题100道附完整答案(网校专.. 39页

2025年光纤预制棒项目建议书 61页

2025年便携式计算机项目发展计划 61页

跨学科主题学习视域下高中英语阅读教学实施策.. 31页

2025年资阳环境科技职业学院单招职业技能测试.. 44页

考虑降雨强度时间模式不确定性的边坡可靠度分.. 7页

2025年长春早期教育职业学院单招职业适应性考.. 45页

2025广西贵港市港北区第四初级中学招募高校毕.. 49页

2025河北雄安人才服务有限公司招聘医疗类岗位.. 46页

胖东来基层员工9886元月薪标准解析 60页

2026年三峡电力职业学院单招职业技能考试模拟.. 43页

2026年党员廉政知识试题(精练) 14页

2026年内蒙古美术职业学院单招职业技能测试题.. 44页

2026年大一c语言期末试题(夺冠系列) 13页

2026年武夷山职业学院单招综合素质考试题库附.. 45页

2025广东云浮市发展和改革局遴选公务员3人参考.. 49页

2026年信阳涉外职业技术学院单招职业技能考试.. 44页

2026年安徽城市管理职业学院单招职业适应性考.. 37页

2025年湖南省建设工程工程量清单计价办法(新).. 51页

2025年江西信息应用职业技术学院单招职业适应.. 127页

2025年江西信息应用职业技术学院单招职业倾向.. 73页

喝酒给老婆的检讨书 6页

vae乳液低温发泡工艺 29页

《口蹄疫》ppt课件 42页

自然条件对城市的影响 48页

DL T 5783-2019《水电水利地下工程地质超前预.. 36页

德国科隆柯伦巴艺术博物馆_建筑空间解析 14页