文档介绍:声学模型的研究及在关键词识别系统中的应用摘要音节,声韵母等不同基本单位作为识别基元的优劣,并对关键词识别语音识别技术近年来高速发展,有着广阔的应用前景。让机器听懂人说话,甚至实现与人的交流是人类一直以来梦寐以求的愿望。现在语音识别技术的研究工作主要集中在大词汇量连续语音识别的范畴,但是对汉语而言,在提高系统识别率和系统鲁棒性方面都有大量的工作要做,这仍然是个任重而道远的任务。本文首先介绍了在语音识别中广泛应用的隐马尔可夫模型的基本理论。同时为了将该模型引入到语音识别的实际应用,讨论了它的三个主要问题和主要算法。接着介绍了本文中普通话数字声学模型所使用的语料库和训练环境,分析了普通话数字的声学特点并研究了其训练方法。更详细分析了普通话数字的识别难点和声学模型缺陷。针对连续数字识别的难点从标注和模型自身两个方面提出相应的模型优化办法来对其改进。获得大量的实验数据后,对实验结果进行了总结和分析,肯定了模型训练优化方法的有效性。随后对汉语普通话的声学特点进行了详细介绍,分析了音素,系统进行了介绍,对于两种不同结构的关键词系统进行了比较分析。为了改善关键词系统的拒识性能,训练出关键词反词模型,并获得了竞争词似然度测试结果,对两者进行了比较和分析。最后对本篇论文所做的工作进行了总结和展望。关键字:语音识别连续数字声学模型反词模型关键词检测
知识水坝***@pologoogle为您整理
胁砥脚脚印譭曲謉Ⅵ.沙鷇,,.衋謉柚皀曙,瑃.’,.’琫.【,。瑃琣,,甌瑃
知识水坝***@pologoogle为您整理
骶旧—..瓵,,—,
盆噍丝豪盔日期:丝翌:丝导师签名:互豪文注释:本学位论文不属于保密范围,适用本授权书。本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:关于论文使用授权的说明研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论兰独创性虼葱滦声明成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑日期;日期:。
第一章绪论本课题研究的目的和意义之一。作为一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,它与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。而这一技术的应用已经逐步发展为一个具有竞争性的新兴高技术产业。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来年内,语音识别技术将进入工业、家电,通信、汽然而尽管目前语音识别技术已经有了突破性的进展,但是要真正完成一个能还是非常困难的。目前,只能对识别系统的应用领域加以限制,针对某些特殊的大部分对话系统的语音识别部分都是通过关键词技术实现的。在这种系统中都可以通过关键词检测而识别出整个句子的主题意思,从而对说话人的语音做出无论是普通语音识别系统,还是关键词识别系统、说话人识别系统,声学模型都是其识别技术的基础,识男桃簿褪谴侗鹩镆粲爰扔猩P偷谋冉虾但能极大地提高特定环境下的系统识别性能,也能够提高系统稳健性,能够应用本文根据踟Ⅸ的模型训练工具集进行了训练环境的系统搭建,对其中的算法进行了优化。并对中文连续数字声学模型和数量值ノ声学模型进行了细化研究,探索出大量独特的模型改进方法,并做了大量分析以提高整体系统识别性能。包括:针对普通话数字的声学特点,提出音节、音素混合模型、基于说语音识别技术是年至年间信息技术领域十大重要的科技发展技术车电子,医疗、家庭服务、消费电子产品等各个领域。够处理自然语言、同时又不受领域限制的语音识别系统,就现有的技术水平来说需要设计语音识别系统,即特定领域的对话系统。对话系统是解决自然或者口语语言理解的有效途径。面对的是人们日常生活中的口语,与听写机的语言相比发音随意很多。这样对一些不合语法的句子,甚至有不流利、重复、修改、内容不完整等复杂的口语现象,响应。匹配过程。所以声学模型对语音识别有着极为重要的意义。一套好的声学模型不到各种不同的噪声环境下,适应不同的说话人。北京螗电人学硕士论文声学模型的研究及在