文档介绍:新疆大学
硕士学位论文
维吾尔语孤立词和连续数字语音识别系统的设计与实现
姓名:诺明花
申请学位级别:硕士
专业:计算机应用
指导教师:吾守尔·斯拉木
20060522
维语数字音子特性建立音子模型,在经典齐次删模型捎昧嘶诰劾嗟姆椒ㄑ盗凡考模式,识别用算法,采用直接对删模型输出的音子类别串分析而得识别摘要目前,语音识别最主要的研究途径是采用统计模型矶煞蚰P偷的方法以及人工智能缟窬的方法。本文完成了维吾尔语特定人小词汇量孤立词语音识别捎肐P,用基本实现了小型引擎;在此基础上用对维语连续数字识别中的数字录音、灸P脱盗和识别算法进行了仿真。论文的主要工作由两部分组成。第一部分小词汇量特定人孤立词维吾尔语语音引擎的建立是基于侗鸱椒ǎ渫ㄓ眯员冉虾谩L崛∶范蛊灯滋卣鞑问氡旧杓剖笔褂惴āW远ㄒ宓墓铝⒋蚀实淠谌荩褂盟玫穆氡纠葱纬纱实湫⌒,它充当参考模扳库。识别模块中用动态时间规整识别方法计算失真度肥暇嗬最低的模板,在词典中搜索与其名称相同的单词,并在用户界面上显示此单词0迕,即识别结果。第二部分工作就是孤立数字识别的基础上,研究维语数字串识别。首先具体分析十个结果。在分析基础上用仿真维语连续数字识别中的灸P脱盗泛褪侗鹚惴ā它可以完成不定长度数码串疚牟馐粤顺ざ任、的数字串氖侗鹑挝瘛关键词:维吾尔语;孤立词识别;连续数字识别;梅尔频率倒谱特征;隐马尔可夫模型新捌大学顿士学位论文
琑噪辻咖,瓼瓼.;/;籑籋新疆大学硕士学位论文..,甌琩篣籭;;,,琧,
.删中的状态序列符号说明聊Ⅲ模型隐马尔可夫模型离散隐性马尔可夫Ⅲ连续隐性马尔可夫半连续隐性马尔可夫动态时问规整矢量呈化线。陛预测系数线性预测倒谱系数梅尔德实蛊紫凳刺R聘怕示卣输出符号概率矩阵初始状态分布矢量’唧Ⅱ申的状态符号腗中的输出符号序列;
,有效地了解、识别语音和其它声音。准确地识别出语音的内容,并根据其信息意图去执行某种操作。从计算机学科角度来看,语音识别可视为计算机的智能接口技术;从信息处理学科来看,语音识别属于语音信号处理的一个重要分支:从自动控制学科来看,语音识别属于模式识别的一个重要部分⋯。作为酆涎Э疲镆羰侗鹗且杂镆粑Q芯慷韵螅怯镆粜藕糯淼囊桓重要研究方向。它涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,其目标是实现人与机器,进行自然语言通信。语音识别系统在实际应用过程中根据不同的分类准则可以有多种分类方式。从说话人发音方式的不同,可以根据说话时词与词之间有无停顿把语音识别研究分为孤立字语音识别系统、连接字语音识别系统及连续语音识别系统。根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。对于特定人语音识别系统,每一个使用者都必须建立专用的参考模板库。非特定人语音识别原则是事先用许多人的语音样本训练系统,使用者无论是否参加过训练都可以共用一套参考模板来进行语音识别。根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。词数小于时称为小词汇表,至莆V写驶惚恚以上称为大词汇表“目前代表语音识别技术最高水平的语音识别系统是非特定人无限词汇的连续语音识别系统。研究主流是大词汇量非特定人连续语音系统,但是事实上,对于许多日常应用来说,一个语音识别系统只要一组词汇或命令,它就可能为用户提供一个有效的工具。从语音识别研究的进展米看,国际上孤立词识别系统的词汇量已经扩大到几万,特定人或非特定人的连续语音识别系统已经达到了很高的识别率。从研究领域上来看,在连续语音流中识别出关键词的研究,以及利用语音处理技术进行多种语言之间的自动翻译系统的研究缰腃项目堑鼻敖先让诺目翁狻薄薄R缘缁坝镆羰侗稹⒆远缎畔查询、语音信息检索、语音自动文摘等为代表的应用研究异常活跃;以语音产生的非线性模型、实际环境下的鲁棒语音识别等为代表的基础研究是当前的研究热点。随着网络技术和无处不在的移动计算技术的迅速发展,出现了网络环境下的语音识别技术、嵌入式和计算资源有限时的语音识别技术、语种识别技术、基于语音的情感处理技术等一些新的研究方向。比较典型而成功的语音识别系统有于年开发的系统,该系统是有五新疆大学硕士学位论文
.镆羰侗鸺际醯难芯一个可识别十个英文数字的孤立词语音识别系统——低常饕7椒ㄊ峭ü瞬ㄆ个单词一受话人付费电话,一定人呼叫,一第三方付费电话,一话务员协助呼叫和庞每ê艚的非特定人小词汇量语音识别系统,应