1 / 63
文档名称:

VQ和HMM在语音识别中的应用(可复制论文).pdf

格式:pdf   页数:63
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

VQ和HMM在语音识别中的应用(可复制论文).pdf

上传人:mkt365 2013/11/12 文件大小:0 KB

下载得到文件列表

VQ和HMM在语音识别中的应用(可复制论文).pdf

文档介绍

文档介绍:和谟镆羰侗鹬械挠τ摘要导师赵力教授关键词:语音识别;矢量量化;隐马尔可夫模型;讲者自适应硕士研究生曾昭才作为高科技应用领域的研究热点,语音识别技术从理论的研究到产品的开发,是一项公认的极具挑战性和市场价值的工作,具有很强的理本文研究了矢量量化和隐马尔可夫模型τ糜谟镆羰侗探讨了语音识别的基本概念,分类和应用,并论述语音识别的发展和研究现从语音的发声原理开始,分析了语音参数对语音识别性能的影响,研究了基于和挠镆羰侗鹣低车牟问崛》椒ā探讨了矢量量化技术的原理,研究了矢量量化技术在语音识别中的应用。应用,并详细介绍了利用盗泛褪侗鸬木咛迨迪帧让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的追求。论研究意义和实际应用价值。技术的原理和方法。主要研究工作如下:状。探讨了隐马尔可夫模型睦砺垡约耙矶煞蚰P驮谟镆羰侗鸾淼通过研究,提出了矢量量化和隐马尔可夫模型相结合的—P停应用到数码语音识别中。东南大学无线电工程系东南大学硕十学位论文
知识水坝***@pologoogle为您整理
.琣,,篫—琒簆,疭琲甋瓵东南人学硕士学位论文
知识水坝***@pologoogle为您整理
—,,,:瑆,东南大学硕十学位论文
研究生繇倒翩虢址日期:逍、;研究生签名:≤事大寥掌冢捍东南大学学位论文独创性声明东南大学学位论文使用授权声明的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布ǹ论文的全部或部分内容。论文的公布括刊登谌ǘ洗笱а芯可喊炖怼本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得已在论文中作了明确的说明并表示了谢意。论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人/
,从而达到对语音进行识别或者确认的目的。语音识别不同于说话人识别,后者利用的是语音信号中说话人的个性特征,不考虑语音中字词的含义,强调的是说话人的个性;而前者的目的是识别出语音信号中的语义内容,并不考虑说话人,强调的是语音的共性。图卜一怯镆羰侗鹣低车目蛲迹镆羰侗鹬饕S梢韵录覆糠肿槌桑图语音识别系统框图预处理包括对语音数据进行端点检测、预加重、加窗、分帧等。在语音识别系统中特征提取是最重要的一环,特征提取就是从说话人的语音信号中提取出表示语音的基本特征。提取的特征应能有效地区分不同语音,并且对同一说话人保持相对稳定。语音识别系统中常用的特征有:由线性预测系数及其倒谱系数,如声道冲激响应、自相关函数、声道面积函数以及倒谱系数等,其中倒谱系数有最好的识别效果。由语音频谱直接导出的参数,由于语音的端时谱中包含有激励源和声道的特性,因而可以反映说话人的差别。已经使用的参数主要有
.J狡ヅ功率谱、基因轮廓、共振峰频率带宽及其轨迹、语音帧能量、混合参数:为了提高系统的识别率,部分原因也许是因为究竟哪些参数是关键因素把握不充分,相当多的系统采用了混合参量构成的矢量。和谟胛谋疚薰氐挠镆羰侗鹣低持欣玫蛊紫数、差值倒谱系数、基音频率、差值基因频率作为特征矢量,得到了比单用任意一个参数好得多的识别效果。目前针对各种特征而提出的模式匹配方法的研究越来越深入。这些方法大体概率统计方法语音中说话人信息在短时内较为平稳,通过对稳态特征如基音、声门增益、低阶反射系数的统计分析,可以利用均值、方差等统计量和概率密度函数进行分类判决。其优点是不用对特征参量在时域上进行规整,比较适合文说话人信息不仅有稳定因素⑸鞴俚慕峁购头⑸肮,而且有时变因素锼佟⒂锏鳌⒅匾艉驮下。将识别模板与参考模板进行时间对比,按照某种距离测定得出两模板间的相似程度。常用的方法是基于最近邻原则的动态时间规整矢量量化方法矢量量化最早是基于聚类分析的数据压缩编码技术。状谓溆糜语音识别,把每个人的特定文本编成码本,识别时将测试文本按此码本进行编码,以量化产生的失真度作为判决标准。实验室的肰辛斯铝⑹治谋镜挠镆羰侗鹧芯俊U庵址椒ǖ氖侗鹁ǘ较高,且判断速度快。倒谱系数等等。可归为下述几种:本无关的语音识别。动态时间规整方法东南大学硕士学位论文
.铝⒋省⒘哟屎土镆羰侗鹣低语音识别系统的分类式,及其可能的应用范卧”。隐马尔可夫模型方法隐马尔可夫模型是一种基于转移概率和传输概率的随机模型,最早在蚼挥糜谟镆羰侗稹K延镆艨闯捎煽晒鄄斓降姆判蛄凶槌的随机过程,符号序列则是发声系统状态序列的输出。在使用侗时,为每个说话人建立发声模