1 / 74
文档名称:

基于HMM的汉语数字语音识别系统研究.pdf

格式:pdf   页数:74
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于HMM的汉语数字语音识别系统研究.pdf

上传人:banana 2014/5/16 文件大小:0 KB

下载得到文件列表

基于HMM的汉语数字语音识别系统研究.pdf

文档介绍

文档介绍:湖南师范大学
硕士学位论文
基于HMM的汉语数字语音识别系统研究
姓名:侯周国
申请学位级别:硕士
专业:电路与系统
指导教师:钱盛友
20060401
中文摘要’哆语音是人与机器之间进行交流的重要工具,语音识别技术就是让机器听懂人类的语音并执行相关动作,具有广泛的应用背景。虽然在这方面的研究有很多,但目前仍有许多问题有待进一步探索。语音的声学模型和识别理论是构建语音识别系统的基础。本文首先介绍了语音的声学模型结构,然后按照语音识别系统的处理步骤详细地分析了各个过程。在语音信号的端点检测方面提出了改进的谱熵算法,实验表明用该方法进行端点检测后提取特征参数可提高语音识别系统的鲁棒性。特征参数的选取对整个语音识别系统的实时性、鲁棒性有很大的影响。文中对语音信号的短时时域特征和语谱图进行分析后,详细阐述了线性预测分析系数⑾咝栽げ獾蛊紫凳及德实蛊紫凳忍卣鞑问奶崛》椒ǎ⒍云涫д娌舛进行了讨论。文中论述了动态时间归整理论和隐马尔可夫模型原理,用语言编程研究了它们在语音识别系统中的应用。用砺劢泄铝词语音识别时比较了特定人和非特定人识别及特征参数的选择对识别率的影响。此外,实际构建了基于P偷姆翘囟ㄈ诵⌒凸铝⒋语音识别的整个系统,该系统可选用不同的特征参数,具有较好的鲁棒性。用该系统对“鍪纸辛耸侗鹗笛椋笛榉⑾钟参数时,选取维的识别效果最好;维的参数的识别率比维的参数的识别率高%左右。关键词:语音识别,线性预测倒谱系数,德实蛊紫凳间规整,隐马尔可夫模型、~,
,/琇,..’瑃————.!猧.,獀猧,■
,,,,:瓺.——琤一%.狥,.■,●
第一章绪论要的科技发展技术之一。随着人机自然交互牡谌际醯语言是人类特有的功能,是人类之间交流、传递信息的最简便、最有效、最自然的工具。用现代化的语音处理技术,使人类更加有效的产生、传输、存储、获取和应用语音信息,对于社会的进步与发展具有及其重要的意义。人们对计算机语音的研究主要有以下几个方面:语音编码、语音合成、语音识别、语音增强、说话人识别与语种辨识及语音信息中的情感信息处理等。在世纪中期,语音识别作为一门新学科产生,而且语音识别技术将是未来的信息领域的最为重发展,语音识别技术在近年来得到了突破性的进展,使人们和机器的对话正在成为可能。卜镆羰侗鸶攀语音识别,属于多维模式识别和智能计算机接口的范畴。语音识别研究的根本目的就是研究出一种具有跟人类一样有“听觉”功能的机器,能直接接受人的口呼命令,理解人的意图并作出相应的反应。语音识别技术以语音信号为研究对象,涉及到语言学、信号处理、生理学、心理学、计算机科学等多个相关的学科领域。语音识别在工业、军事、交通、医学、民用诸方面,特别是计算机、信息处理、通信与电子系统、自动控制等领域中有着广泛的应用。当今语音识别产品在人机交互应用中,所涉及的领域已经越来越多。早在世纪年代,人们根据声学理论进行着语音识别系统的研究甑谋炊笛槭业腄等人研制了特定说话人孤立数字识别系统,该系统利用每个数字元音部分的频谱特征进行识别。基于暮河锸钟镆羰侗鹣低逞芯
汇量、连续语音和非特定人这三大障碍,第一次把这三个特性一起集成于一个系统中,并以此确定了统计方法和模型在语音识别和语言处理中的主流地位。进入年代以及到现在,语音识别步入了高速发展时期,语音识别在某些领域已经走向成熟,同时随着多媒体时代的来临,迫切要求语音识别系统从实验室走向实用。年代语音技术的另一个主要趋势是语音识别在日趋完善的同时开始与其他领域的技术相结合,人们开始进一步研究语音识别与自然语言处理的结合,产生了基于口音识别和理解的人机对话系统。语音识别与机器翻译技术相结合,发展了面向不同语种人类之间交流的直接语音翻译通信技术,如国际七国语言同声翻译计划,猄,即通过“语音识别一机器翻译一语音合成”将一种语言直接转换成另一种语言。这些技术的产品在逐步开始走向实用化∞我国语音识别研究的起步要比先进国家晚,但是进步很快。由于汉语音节种类较少,结构很规则,便于以音节识别为基础实现无限词汇识别,因而获得了与相比拟的成果,在汉语语音识别系统的基础理论、数学模型、算法和实用系统开发等方面作了大量的工作并取得了一系列的成绩。中科院声学所,中科院语言所,清华大学,中国科技大学等先后研制出了汉语语音识别系统,但是有规模的商用推广技术还不成熟,产品的语音在质量上还不能满足人们的要求。国际上也非常基于暮河锸钟镆羰侗鹣低逞芯
⒁舴绞椒掷嗖孤立词语音识别,系统是指人在发音时,以单字词的发音方式向语音识别系统输入语音。说话人每次只说一个字,一个词组或一条命令输入系统,采用这种方式的语音识别系统实现起来较为容易,字词的识别率也可以做到很高。这一类的语音识别系