文档介绍:汉语语音合成中自动切分技术的研究摘要基于大语料库的拼接合成由于其合成的语音清晰自然,而得到了广泛的应用。由于汉语语音合成中自动切分的精度将直接影响到语料库中基元的质量,进而直接影响到合成出的语音的质量,因此自动切分技术已经成为了汉语语音合成中的一个重要课题。在自动切分技术的研究中,作者详细地调查了自动切分的研究现状。根据研究现状,采取了目前较主流的基于隐马尔科夫模型的强制对齐的方法用于自动切分基线系统的构建中。在自动切分基线系统的构建中,作者提出了一种新的模型参数自适应方法,结果证明可以较大程度地提高自动切分的精度。作者还做了大量的实验来验证相关的语音参数在自动切分中的效果,大多数参数的挑选都被同类论文忽视,但在实际系统中却有着重要的影响。在现有的自动切分技术中,大多数研究都是基于单一模型,上下文相关或上下文无关的模型。采用单一模型内在的问题是每个边界单元只有一个模型预测的时间值,而没有考虑不同的模型对于相同声学环境下的边界的不同的作用。作者在论文中提出了以下两种方法来找到处于类似声学环境下的边界与不同模型之间的映射规则,进一步用映射规则来为每个边界找到最合适的模型。第一,利用混合模型进行汉语语音合成库的自动切分技术。所有的边界单元按照其所处的声学环境被分为十一组。在这些边界组中,将利用混合模型训练得到边界组与声韵母单音子模型騇、半音节单音子模型。声韵母三音子模型之间的映射规则。第二,、和之间的映射规则,通过映射规则,为每个边界单元选取最合适的模型预测时间值。在决策树的构建过程中,问题集的选取和属性的挑选至关重要。在论文中,作者给出了自动切分中,选取问题集的方法,。实验结果显示,在切分精度和边界的偏移上,利用混合模型和决策树分类两种方法都取得了比单一模型进行汉语语音合成库的自动北京邮电大学硕士学位论文
知识水坝***@pologoogle为您整理
切分技术更好的结果。关键字语音合成远蟹只旌夏P途霾呤北京邮电大学硕士学位论文汉语语音合成中自动切分技术的研究Ⅱ
知识水坝***@pologoogle为您整理
..卜兀瓸猧.、虹,—甌產瑃..’.甿瑆,甀瑃北京邮电大学硕士学位论文汉语语音合成中自动切分技术的研究
姗.—,猙瑂畇..,
苤些差丝之丝£海豪厶∥/.乎,,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,:学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、:本学位论文属于保密在一年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授日期:导师签名:权书·.一
第一章语音合成概述研究意义语音合成基本原理语音是人们之间相互交流的重要手段,也是人机交互中最为方便直接的方式,能够实现人机之间自然的语言交流是许多计算机科学家和语言学家的梦想。语音识别技术的发展使得计算机能够“听懂”人类的语言,而语音合成技术则使计算机能够“说出”,如何做到让听话人能理解你的意思并感知你的情感呢浴坝镆簟钡囊G笫牵嚎啥⑶逦⒆匀弧⒕哂斜硐至ΑU饩褪怯镆合成追求的目标,但这可不是一件容易的事。语音合成是一门跨学科的前沿技术,涉及到下列相关研究领域:自然语言理解、语言学、语音学、信号处理、心理学、声学等。如果将上述领域的研究成果结合在一起,语音合成才能实现追求的目标。目前,计算机屏幕显示这种单调的信息输出方式给用户带来许多不便,特别是在有大量信息输出的情况下。长时间地注视显示屏容易使人疲劳,并会降低人获取信息和理解信息的效率。这种枯燥单一的交互方式影响了计算机的应用。如果计算机具备说话的能力,具有对信息进行讲解的能力,就能提供声文并茂的信语音技术已是世界强国竞相研究的热点之一,国内一些科研单位对汉语进行了大量的研究,其中清华大学、中国科技大学、中科院声学所等单位都取得了很好的成绩。目前该项技