文档介绍:摘要语音识别是一门内涵丰富,应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。在语音识别系统中,隐马尔可夫模型是当前最为流行的语音识别模型,占据着主导地位。P椭杂τ媒衔3晒Γ饕J撬哂薪锨康亩允间序列结构的建模能力,尽管如此,际跻泊嬖谝恍┤钡悖纾壕霾叻掷嗄芰θ酰需要语音信号的先验统计知识等。人工神经网络方法作为模拟人脑思维机制的工程模型,它与孟喾矗浞掷嗑霾吣芰投圆蝗范ㄊ挛锏拿枋瞿芰σ训玫骄偈拦认,但它对动态时间信号的描述能力尚不尽如人意。本论文在介绍P秃腿斯神经网络的基本原理的基础上,将两种方法有机结合,进一步提高语音识别的准确率。对于含噪语音信号的有效特征提取是语音识别至关重要的一步。本论文首先介绍了在语音识别中最常用的两种特征参数:基于发声系统模型导出的线性预测倒谱系数、基于听觉系统模型导出的德实蛊紫凳饬街痔卣鞑问诖烤挥镆粝率侗鹦果比较好,但是在噪声环境下识别效果不尽如人意。接着提出利用小波变换对含噪语音信号进行去噪的方法,再经瞬ㄆ髯樽;晃狹频率下的倒谱系数,这种新的特征参数进一步反映了语音信号的动态特性、增强抗干扰能力,从而提高了识别率。提出了用隐马尔可夫和人工神经网络混合模型对语音信号进行识别的方法,即有效的运用了经典P投远奔湫蛄薪锨康慕D芰Γ殖浞掷昧巳斯ど窬网络较强的分类决策能力。实验证明,该模型适合于对噪声背景下的语音进行识别,同经典的P拖啾冉希哂懈玫目乖肼嘲粜裕谛旁氡冉系偷那榭鱿拢侗率比经典的P陀忻飨缘奶岣摺关键词:语音识别,小波变换,隐马尔可夫模型,人工神经网络,疉长春工业火学硕士学位论文
知识水坝***@pologoogle为您整理
.甌甌,篠燃琣.—,疉:琀/疉,..琤、Ⅳ℃
知识水坝***@pologoogle为您整理
论文作者躲前磕謦日期:力卯争月,日原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。长春工业大学硕士学位论文
第一章绪论引言选题的目的和意义语音识别是机器通过识别和理解过程把语音信号转换为相应的文本文件或命令的高技术。作为一个专门的研究领域,语音识别又是一门交叉学科,它与声学、语音学、语言学、人工智能、数字信号处理、信息理论、模式识别理论、最优化理论、计算机科学等众多学科紧密相连【。随着通讯技术的飞速发展,人们对语音通讯的依赖越来越大,人机通讯成为越来越尖锐的瓶颈问题,亟待解决【俊T谡庵智榭鱿拢绾稳眉扑慊悄芑赜肴私型ㄐ牛使人机交互更加自然方便成为现代计算机科学的重要研究课题之一。如果计算机能够听懂人类语音,能够说话,那么就不会有键盘,不同语言的人们交流就会更容易,这个愿望实现的技术基础是语音识别和理解【。语音识别将人发出的声音、音节或短语转交通、医学、民用等诸多方面,特别是在计算机、信息处理、通信与电子系统、自动控制等领域有着广泛的应用。它在一些应用领域中正迅速成为一个关键且具有竞争力语音识别作为一项具有广泛社会效益和经济效益的现代信息技术,虽然已经取得了巨大的成就,但是面偈涤没被故谴嬖谝幌盗械奈侍狻NA舜锏绞涤没蜕桃祷的目标,语音识别系统必须具有自然性、可靠性及鲁棒性。人类最重要的基本功能之一是通过语言互相传递信息。虽然,人可以通过多种手段获得外界信息,但最重要、最精确的信息源只有语言、图像和文字三种。用声音传递信息,显然比用图像和文字传递信息,其效果要好得多。这是因为语言的传播速度快,没有明显的方向限制,又可以在黑暗中传播。而且,语言中除包含代表实际发音内容的语音信息以外,还包括发音者是谁及喜怒哀乐等各种信息。另一方面,语言与人的智力活动密切相关,与文化和社会的进步密切相连,它具有最大的信息容量和语言是人类进行思想、观点和情感交流最自然便捷的交互方式,而不同语种国家的人在交流上必然存在着一定的局限和障碍。突破这个障碍,使得不同语种国家的人们进行无障碍的语言交流和文化交流,是许多人的梦想。如果能把具有语言信息处理能力的机器和设备纳入人的语音交互对象,使之像人一样具备听、说、写功能,能对语音做出理解和反应,并在交互方式上不受时间和地点的限制,将使人类的生活和工换成文字和符号,或者给出响应,如执行控制、做出回答。语音识别在工业、军事、的技术最高的智能水平。长春工业大学硕士学位论文
语音识别技术的发展史与现状作方式发生革命性的变化。以语言科学为基础的语音交互信息技术由此应运而生。随着信息时代的到来,计算机已经成为人类不可缺少的日常工具。在现代社会中,人们逐渐习惯借助计算机来完成各项事务,在这种情况下,如何让计算机