文档介绍:摘要随着目前语音合成效果的逐步改善,用户对语音合成系统提出了更高的要求,体现在合成系统的构建复杂度以及系统的音质。在这种背景下,一种能够在短时间内通过自动训练的方式进行合成系统构建,而且能够获取比较好的音质的语音合成系统,有着比较高的理论研究及使用价值。对此,本论文在基于的可训练语音合成基础上,提出了一种能够在不大量增加系统负担的前提下有效的提高合成语音音质的方法。本论文具体的研究工作和研究成首先,对现有成熟的低辰幸桓霰冉舷低橙娴慕樯埽樯其中的基础理论:隐马尔科夫模型约跋低呈迪值囊恍┕丶际酰为下一阶段的工作提供了一个高效的平台系统。其次,基于上面介绍的低晨蚣埽攵源讼低车暮铣捎镆糁械塞音比较模糊的现象进行分析,并且提出了用自然的塞音段频谱参数来替换对应模型预测的频谱参数来进行参数生成,最后,结合自然的塞音波形和自然的塞音频谱,用频谱替换和波形替换方法实现了一个塞音清晰化的系统。最后,基于上面的自然塞音频谱参数替换的想法,提出了结合自然样本单元挑选与参数生成相结合的方法来提高合成语音的音质,通过相关的试验可以证明这种方法能有效的提高合成语音的音质:通过对频谱参数进行压缩,可以进一步的减少参数的存储量,使其在受限领域的应用成为可能;进一步,为了完善此方法下的参数生成算法,提出了新的参数生成算法,即把自然样本单元当作一个模型约束来控制参数生成的过程;最后,验证了此方法在英文音库下的效果。关键词:语音合成,隐马尔科夫模型,可训练语音合成,单元挑选果如下:中国科学技术大学硕士论文
知识水坝***@pologoogle为您整理
——琫,瑃瑃.,甌,,琲,:,瑆,,琤,瑃,琭,:瑄中国科学技术大学硕士论文.,.
知识水坝***@pologoogle为您整理
,是一门典型的交叉学科【俊】【俊K婕暗声学、语音学、语言学、语义学、信息论、信号处理、计算机、模式识别、人工智能、心理学以及人类的大脑神经活动等众多学科的理论和技术。根据人类语言功能的不同层次,语言合成可以分成三类层次,它们是:垂嬖虼游淖值接音的合成甌甋。垂嬖虼痈拍畹接镆舻暮铣..按规则从意向到语音的合成.。从现有的语言合成的水平来说,可以解决的还是从文字到语音的合成这个阶段,也就是文语转换竺嫠档挠镆艉铣啥际侵肝挠镒;弧图显示了一个完整的语音合成系统框图。这里我们将语音的合成过程看成是一个层次化的分析过程,从文本信息到语音信息的文语转换过程可以看成在不同的层次信息在不同的层面上进行分析处理的过程。在文本的层面上,先要在语言层、语法层和语义层上进行分析,得到文本的层次信息ù首椤⒍逃铩句子等信息H缓笤诓愦位畔⒌幕∩显谟镆舨愕幕∩辖性下煞治觯出语音层面上的韵律信息攵院河锢此稻褪浅舳翁卣鞯纳桑ɑ怠⑹长、能量的综合韵律曲线缓蟾萆傻脑下商卣鳎煤铣善魃苫蛘叽语音库中挑选单元来完成语音数据的最后生成。
.镆艉铣衫坊毓语音合成方法在语言层、语法层、语义层的工作可以归结为前端的文本分析,而语音层面上的韵律生成和声学层面上的按韵律合成语音单元或在音库中挑选单元可以说后端的韵律合成。对于语音合成系统来说,前端的文本分析部分都是相同的,只是由于要求的不同而有不同信息表达方式。而后端的韵律合成方面也可以层次化的分为两个部分,一个就是按照前端给出的层次化文本信息生成合适的韵律,而另一个就是按照生成的韵律来产生最后的合成语音,在产生韵律和合成语音的方法上,各种方法不尽相同,甚至两个部分成为一个不可分割的整体,但是从思想上来说,每个合成系统都包含这样两个方面。我们后面的工作介绍主要是围绕着语音合成系统的后端进行的。语音合成的研究历史可以回溯到世纪,在年研制的机械式语音合成器,这种会说话的机械,是用风箱模拟人的肺、簧片模拟声带、以皮革制成的共振腔模拟声道,通过改变共振腔的形状,它可以合成出一些不同的元音。年第一次按照信号处理的原理设计出一个声音发生器【俊R一些白噪音似的激励产生非浊音信号,以周期性的激励产生浊音信号。模拟声道的共振器是通过一个阶的带通滤波器建模,模型的增益通过人来控制。早期的机械式语音合成器反应了人们对语音产生机理了解的比较粗略,现代语音合成的方法基本上都是采用一种语音模型来合成语音。总的说来,近期语音合成的方法可以归结为三种:物理机理语音合成;源一滤波器语音合成:基于波形拼接技术的语音合成;其中源一滤波器的合成方法又可以分为合成和共振峰合成等:另外近些年,畇【糠椒ū还惴旱挠τ迷诨诓ㄐ纹唇蛹际醯挠镆艉铣上低持校庵址椒ǹ梢在一定范围内调节语音信号的基频和时长,而对语音音质的损伤很小。关于对早期语音合成研究的历史和方法,在】【俊】【恐杏邢晗附樯堋O旅我