1 / 73
文档名称:

基于统计模型的韵律结构预测研究(可复制论文).pdf

格式:pdf   页数:73
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于统计模型的韵律结构预测研究(可复制论文).pdf

上传人:mkt365 2013/11/11 文件大小:0 KB

下载得到文件列表

基于统计模型的韵律结构预测研究(可复制论文).pdf

文档介绍

文档介绍:基于统计模型的韵律结构预测研究摘要随着计算机技术的进步和其他相关学科的发展,在过去的几十年间,语音合成技术有了迅猛的发展,涌现出了大量的新理论和新技术。在现阶段,语音合成技术主要是以文语转换系统Q究重点,这是一种将输入的文本转换为语音输出的技术。低骋话由文本分析、韵律处理、语音合成三个模块组成。这三个模块并不是相互孤立的,每一个模块的性能都对最终输出语音的质量有很大的影响。对合成系统输出语音音质的评价是多方面的,但主要集中在输出语音的可懂度和自然度两个方面。当前,低车氖涑鲇镆粼诳啥确面已经达到了比较高的水平,而在语音的整体自然度方面还有待提高,其根本问题就是不能对自然语流中的韵律进行有效的模拟。韵律处理的研究主要有以下几个方面:韵律预测,韵律规则,韵律描述和韵律建模。本文主要研究了韵律结构预测模板,希望通过对此模块的研究与改进来提高合成语音的自然度。韵律预测与文本分析之间有着紧密的联系,这是因为低车氖入是无限制的文本,从文本中只确定读音是远远不够的。为了提高语音的自然度,还需要从文本中提取更多的与韵律相关的信息,其中包括文本的韵律结构、重音和语调等信息。研究表明,在低持幸朐下层级结构可以显著提高合成语音的质量,特别是合成语音的自然度。如何提高韵律结构预测的正确率是本文研究的重点。本文从汉语的声学特点和韵律特征出发,分析和研究了汉语的韵律特征、停顿、重音以及韵律边界之间的关系,分析并对比了汉语韵律层级结构,同时分析了韵律边界的声学特征。对传统的韵律结构预测的方法进行了综述和比较,指出传统韵律结构预测方法的优缺点,然后重点研究了基于统计机器学习的韵律结构预测,特别是条件随机场膕和最大熵模型在韵律结构预测中的应用。在基于条件随机场的韵律结构预测系统的研究中,理论上,本文详细阐述了条件随机场的定义,条件分布以及参数估计。在应用上,本文
知识水坝***@pologoogle为您整理
重点研究了条件随机场的特征模板,并讨论了窗长的选取,复合特征的作用等问题。在基于最大熵模型的韵律结构预测系统的研究中,在理论上,本文详细阐述了最大熵模型模型的定义,条件分布以及参数估计。在应用上,本文重点研究了最大熵模型的特征模板,并讨论了窗长选取和动态特征的作用等问题。此外,本文提出了基于最大熵模型的多遍韵律结构预测系统,并和基于的预测系统进行了性能上比较和分析。在韵律短语预测上,前者的性能好于后者。关键词:韵律结构预测条件随机场最大熵特征模板
知识水坝***@pologoogle为您整理
.甋,,.,,甌瓵瑃琤:,琾;.,.,,,..
篜琾心琩琣江琣,現,琣鮳,,...甀,.,
本人签名:—辽葸日期:‘冱与乙上嘁保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论独创性虼葱滦声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笞袷卮斯娑文注释:本学位本人签名:导师签名:适用本授权书。日期:
第一章绪论引言语音是人际交流最习惯、最自然的方式。将文字输入转成语音输出称为文语转换或语音合成际酢緇】。其主要功能是把文本文件通过一定的软硬件转换后由计算机或其他语音系统输出语音,并尽量使合成的语音有较高的可理解度和自然度。它涉及声学、语言学、数字信号处理、多媒体技术等多个领域,是中文信息处理领域的一项前沿技术【。语音合成系统与传统的声音回放系统有着本质的区别。传统的声音回放系统如磁带录音机,是通过预先录制声音然后回放来实现“让机器说话”的。这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而通过语音合成则可以在任何时候将任意文本转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话’’。语音合成技术有多种用途,其中最主要的是用于计算机口语输出。即制造一种会说话的机器,并最终与语音识别技术相结合,形成全新的人机对话系统。而低呈际上是个人工智能系统,同时也具有跨学科的性质。为了合成出高质量的语音,除了依赖于各种规则,包括语义学规则,词汇规则,语