文档介绍:基于闹形挠镆艉铣裳芯摘要语音合成是实现人机和谐交互的关键问题之一。本文对汉语语音合成中的声学建模技术和参数共享策略进行了研究,并以日文文语转换系统为基础,针对汉语的特点进行改造,完成了一个汉语文语转换的原型系统.。具体工作包括:对教ê虷进行了研究和分析,实现了基于平台的声学模型训练方法。以扩展声韵母集作为合成基元的集合,并引入了合成基元的环境信息,进行了上下文相关的声学建模。对声学建模中基于决策树的刺蚕聿呗越辛搜芯浚治隽决策树的构造方法,讨论了问题集的设计。通过基于决策树的刺蚕恚档土四P偷墓婺#刺W刺共享前的ァMü宰刺背和基音周期进行基于决策树的状态共享,并在问题集中引入合成基元的环境信息,从而使训练出的性下傻男畔ⅰ对日文系统的语音合成部分进行了研究和分析,保留其中的参数生成模块和基于的合成器模块,针对中文的特性修改了P投寥∧?楹虷模型搜索模块。重新设计了系统中的文本处理模块。利用《知网》来计算多音字的概念相似度,进行多音字处理,避开了现有实验条件下缺少拼音标注语料的问题。将上述工作组合起来,最终设计并完成了一个汉语的文语转换的原型系统T谟镆宀豢稍げ饩渥听写的测试中,.;同时,合成部分的模型文件仅有S肓硪豢畲笮〗咏⒂τ盟羲和术的文语转换系统相比,自然度明显提高。由于低所需存储量很小,所以它很适用于移动终端或嵌入式应用。关键词语音合成霾呤魃舷挛南喙啬P北京邮电大学硕士学位论文
知识水坝***@pologoogle为您整理
畁狟Ⅺ..,.,瓾/痓’瓺甎瓵Ⅳ【..
知识水坝***@pologoogle为您整理
,.ィ甀甌篴瓹瑃,.琱,,琧甀瓸北京邮电大学硕士学位论文基于闹形挠镆艉铣裳芯
本人签名:露£导师签名:—差;⒛:—·立‘乒骸!S模毫ⅲ海河兰本.:梗合增,本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑非保密论文注释:本学位论文不属于保密范围,适用本授权书。何贡献均已在论文中作了明确的说明并表示了谢意。留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借独创性虼葱滦声明申请学位论文与资料若有不实之处。’
第一章绪论背景语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。语音合成技术的目标是使电脑具有类似于人一样的说话能力,它是当今时代信息产业的重要竞争市场。语音合成技术,它涉及声学、语言学、数字信号处理、计算机科学等多个文字信息转化为可听的声音信息,也即让机器像人一样开口说话。让机器开口说话,最直接的方法就是像录音机那样,将预存的语音按一定规则播放出来。但是,简单的录放合成的语音一字一顿,机器昧十足,不能满足实用的需求。为了合成出高质量的语言,除了依赖于各种规则,包括语义学规则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这将涉及自然语言理解的问题。从这一点讲,语音合成系统实际上也可看作一个人工智能系统。下图显示了一个传统的文语转换系统示意图。文语转换过程是先将文字序列转换成音韵序列,再由语音合成器生成语音波形:其中第一步涉及语言学处理,例如分词、字音转换等,以及一整套有效的韵律控制规则;第二步需要先进的语音合成技术,能按要求实时合成出高质量的语音流。因此一般说来,,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将图挠镒;幌低车囊话憬峁北京邮电大学硕士学位论文基于闹形挠镆艉铣裳芯
列的转换程序,也就是说,文语转换系统不仅要应用数字信号处理技术,而且必须有大量的语言学知识的支持。当然其中语音合成终究还是最基本的部分,.镆艉铣杉际醯姆⒄估主要是让计算机能够产生高清晰度、高自然度的连续语音。近几十年来国际和国内的研究主要集中在文语转换,即将书面语言转换成口头语言。在语音合成技术的发展中,早期的研究主要是采用参数合成方法。值得提灰>牡髡问饬礁龊铣善鞫寄芎铣沙龇浅W匀坏挠镆簟用拇⒘9舱穹搴铣善鳎梢酝ü曜嫉慕涌诤图扑慊虻ザ澜到电话网上提