文档介绍:武汉理工大学
硕士学位论文
基于HMM的汉语语音关键词检测研究与实现
姓名:李星星
申请学位级别:硕士
专业:信号与信息处理
指导教师:阙大顺
20090401
摘要语音是人类相互通信和交流的最方便快捷的手段,让机器能够听懂人类语言或按照人类意志进行相关操作是人们长期以来梦寐以求的目标。关键词检测是自动语音识别的一个特殊分支,其主要任务是从连续的语音中检测出具体应用所需要的少量特定词汇。相对于连续语音识别,关键词检测技术具有资源耗费少、识别率高和实用性强的优点,因此有着广泛的应用前景。隐马尔可夫模型歉骼嘤镆迨侗鹣低车闹髁髂P停峭瓿勺计轿仁北湫藕欧治龊褪别的有利工具,能够很好地描述语音特征的动态变化和统计分布。本文在系统分析关键词检测系统基本框架、怼⒂镆籼卣鞑问崛〖胺中挝惴ǖ基础上,针对现有关键词检测系统在训练样本、填料模板、检测效率、检测时间方面存在的问题,重点研究设计了基于暮河镉镆艄丶始觳庀低常并在填料模板创建、状态搜索算法和检测确认策略等方面做了诸多改进。论文芯苛薍模型的建模过程,详细分析了前向一后向算法、佳路径搜索算法、基于的多观察序列输出高斯混合模型的参数重估算法,以及与之相应的概率输出、最佳状态解码和模型参数估计等问题,为在语音识别中应用蛳铝嘶岢隽嘶诙〕さ挠镆粜藕欧治龇椒ǎ辉谟镆粜藕盘卣魈崛∈保估计当粄镆舻ノ坏某中奔洌俑莩中奔涠范ù俺ぃ蟹种。方案缓解了因为训练样本质量和数量问题引起的关键词检测系统的性能恶化,提高了匹配模板的稳定性,并应用到检测过程中,实现了语速自适应。壑ち擞镆舴中挝恚⒏莘中挝迪至艘艚谑凳狈指睿辉诖嘶上实现了关键词训练系统的样本自动标注和检测系统的两步式状态解码算法。蕴盍夏P偷慕峁购屠嘈徒辛搜芯浚≡夏妇劾嗄P秃鸵艚诟衲P的优点,提出了基于音节聚类的填料模型,节省了系统的检测时间,提高系统菇斯丶适滓艚谀P秃凸丶嗜啡夏P停扔锰盍夏P秃凸丶适音节模型与输入语音片断进行匹配,如果最佳匹配结果落入某类关键词首音节主要研究内容如下:的检测率。武汉理工大学硕士学位论文
域,则把当前的两个候选关键词音节与关键词确认模型进行匹配,并计算帧平均似然得分,对关键词进行确认。⒘艘桓鲂〈柿康难究夂筒馐匝究猓杓剖迪至艘桓龌贖的无语法限制的关键词检测系统,通过仿真实验分析了不同特征参数、帧长方案和填料模板等对系统性能的影响。关键词:语音识别,关键词检测,忠徊罘址中挝盍夏P武汉理工大学硕十学位论文Ⅱ
,琱籥,’..,—...
.琣猻琄,—,琭武汉理工大学硕十学位论文,,.瓼甶,:
碱氧獬钭钚撬⑧边╧陪嗍。岬签名:奎量星独创性声明关于论文使用授权的说明期:兰幽:垒:塑本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何本人完全了解武汉理工大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权武汉理工大学可以将本学位论文的全部内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存或汇编本学位论文。同时授权经武汉理工大学认可的国家有关机构或论文数据库使用或收录本学位论文,并向社会公众提供信息服务。贡献均已在论文中作了明确的说明并表示了谢意。C艿穆畚脑诮饷芎笥ψ袷卮斯娑
第滦髀课题研究的意义与价值进,识别系统的性能得到了极大的提耐小语音是人类进行信息交流最自然、最方便的手段。语音识别技术作为常用人机交互方法,具有极大的优势和便利,只要有机器存在的地方,就有语音技术应用的潜在可能。语音识别的研究目标是让机器识别出人类的语言。近年来,关键词检’狈,作为自动语音识别技术的一个分支【浚其目的是从连续语音中检测并确认给定的若干个特定关键词。关键词识别技术相对连续语音识别技术来说,有很多的优点。首先关键词识别技术是一种孤立词识别和连续语音识别之间的语音识别技术,它不要求把整个的语音流全部识别出来又摆脱了孤立词识别的局限性,可以节省许多计算资源,能够构建相对简单稳定的应用系统。其次关键词识别对发音人的要求不可能像对连续语音识别发音人那么高,连续语音识别中,要求安静的环境,较好的信道,以取得较高质量的语音。但在噪音环境中,性能显著下降。而关键词识别允许在嘈杂的环境中使用,可以通过诸如电话线等质量较差的信道,要求系统能自动判断哪些是词汇表中有的词。可以说在当前技术水平下,许多应用领域不适合连续语音识别,而要求关键词检测。关键词检测的主要应用方向有:羁刂疲河没Э梢酝ü丶始觳庀低晨刂浦