文档介绍:摘要语音识别是近年来高速发展的一项技术。让计算机听懂人说话,甚至和人进行交流是我们梦寐以求的梦想。在不久的将来,这个梦想会变成现实。本文的主要目的是对连续语音识别进行探讨。本文开始先介绍了语音识别的基础知识,详细的讨论了语音信号的处理方法和语音识别系统的原理。接下来本文从两方面进行展开。一方面从模式识别的研究角度,探讨语音信号的提取和语音识别的原理,建立相应的语音识别模型。本文综合了基于的特征提取技术,理、训练算法和单音子模型的建模技术,上下文无关文法的定义和应用,算法等方法,⒆隽斯赜诨合分量维数的实验,结果表明随着混合分量数从岣叩,系统的识别率从.%提高到了.%。针对谢旌戏至渴奶岣叽吹氖奔湎脑黾游侍猓疚难芯苛似然率的快速算法。本文基于实现了部分距离消去算法⒆佳混合预测算法吞卣魇噶吭K刂嘏潘惴。实验结果表明,快速似然率计算方法在可接受的识别率的降低范围内,可显著地降低似然率计算的时间开销。另一个方面从识别系统的软件开发考虑,建立~个基于篮球比赛的数据统计的语音识别系统。介绍了腟谙低持械那度耄樯芰V蟾鲆桓鍪道擞肧⒘四芄皇侗鸲喔鼍湫秃图甘龃驶的一个限定领域的连续语音识别系统,用作篮球比赛数据统计系统的语音界面,经测试系统的识别率可以达到%,之后介绍了噪声控制的一些技术和提高系统语音识别率的方法。关键词:连续语音识别、快速高斯计算、●
聎..琲琺琤甅,.瑃.%.%....,瑃..瑂瓼甌琽琣猻琀.—.’,州一
篶.,,%.
认干钿壹旭厦门大学学位论文原创性声明兹呈交的学位论文,是本人在导师指导下独立完成的研究成果。本人在论文写作中参考的其他个人或集体的研究成果,均在文中以明确方式标明。本人依法享有和承担由此论文产生的权利和责任。声明人┟:
期:词年扫期:晗缭日厦门大学学位论文著作权使用声明⒉槐C堋本人完全了解厦门大学有关保留、使用学位论文的规定。厦门大学有权保留并向国家主管部门或其指定机构送交论文的纸质版和电子版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅,有权将学位论文的内容编入有关数据库进行检索,有权将学位论文的标题和摘要汇编出版。保密的学位论文在解密后适用本规定。本学位论文属于⒈C年解密后适用本授权书。朐谝陨舷嘤ê拍诖颉啊獭作者签名:导师签名:
第一章绪论语音识别概述语音不仅是人类之间进行信息交流最自然、最有效、最方便的工具,而且也是人与机器之间进行通信的重要工具。语音技术作为常用人机交互方法,具有极大的优势和便利。只要有机器存在的地方,就有语音技术应用的潜在可能。语音识别是让机器通过识别和理解的过程把语音信号转变为相应的文本或命令的技术【俊S镆羰侗鹱魑酆涎Э疲杂镆粑Q芯慷韵螅怯镆粜藕处理的一个重要研究方向,它是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言人在说话时的表情、手势等行为动作可帮助对方理解渥钪漳勘晔鞘迪秩擞机器进行自然语言通信。语音识别技术可以用在语音指令控制方面,例如,在一些工作环境恶劣、对人身有伤害的地方绲叵隆⑸钏胺洹⒏呶碌或手工难以操作的地方,均可通过语音发出相应的控制命令,让设备完成各种工作。比如地下采掘作业,工人们不必再置身于随时面临危险、污染严重的环境下工作,他们可以在地面上的监控室,通过专用语音控制系统,轻松地口述各项指令,指挥操作多台采掘设备,实时处理现场出现的各种情况。公司研制出大词汇非特定人语音听写系统,并向市场推出医用听写机系统。它是专为医生设计的听写机系统,成为医生的文秘助手。医生可将病人的病例、治疗方案和医疗报告等直接“口授扑慊缘缱拥蛋肝募保存,并可同时打印输出。语音查询是语音识别的又一个应用领域,可用于旅游业及服务业的各种查询系统。如语音自动导游系统,游客只要说出自己当前的位置和感兴趣的景点名称,系统便自动显示出图文并茂的最佳路线、乘车方案、费用及其他相关信息,如果游客还需要进一步了解更为详尽的资料,则可以同系统进行交互式的对话,系统将对用户的问题一一给予答复。日本丰桥大学研制的“富士山旅游咨询系统”就是一个较为实用的语音查询系统,该系统可用日语英语等进行查
语音识别现状询。又如语音自动订票系统,订票者只需对系统说出搭乘时间和目的地,系统就会显示出符合定票者要求的各班次票价及售票情况,用户根据情况,通过系统做出适当的选择。美国的卡内基梅隆大学计算机系于年研制出语音航空定票系统,在此方面做了有益的尝试。电话是电子技术在世纪应用最广泛的形式之一,在电话中内置“语音拨号’’功能,人们只需一次性地输入寥人名和电话号码,在以后的使用中便可以直接对着电话“说出’’要通话人的姓名,经语音识别后,查出该姓名所对应的号码,然后自动进行