1 / 51
文档名称:

语音合成.ppt

格式:ppt   大小:3,412KB   页数:51页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

语音合成.ppt

上传人:xunlai783 2018/1/2 文件大小:3.33 MB

下载得到文件列表

语音合成.ppt

文档介绍

文档介绍:语音合成
1 概述
1
2 语音合成的原理及分类
3 共振峰合成法
3
4 线性预测参数合成法
4
5 基音同步叠加法
5
6 文语转换系统
6
2
概述
语音合成是人机语声通信的一个重要组成部分,解决让机器像人那样说话的问题。
Kempelen发明,经Weston改进的机械式会讲话的机器。而最早的电子式语音合成器也是1939年Homer Dudley发明的声码器,它不是简单的模拟人的生理过程,而是通过电子线路来实现基于语音产生的源-滤波器理论。
在语音合成技术发展中,早期研究主要是采用参数合成方法。
1990年提出的基音同步叠加PSOLA方法,使基于时域波形拼接方法合成的语音音色和自然度大大提高。
我国的汉语语音合成研究从80年代初就基本上与国际研究同步发展。大致也经历了共振峰合成、LPC合成到应用PSOLA技术的过程。
语音合成的原理及分类
波形合成法
波形编码合成法是一种波形合成法,类似于语音编码中的波形编解码方法,该方法直接把要合成的语音的发音波形进行存储或者进行波形编码压缩后存储,合成重放时再解码组合输出。
特点:所需的存储容量太大,词汇量不能很大;相对简单,通常只能合成有限词汇的语音段。目前用于自动报时、报站和报警等。
另一种波形合成法是波形编辑合成,它把波形编辑技术用于语音合成,通过选取音库中采取自然语言的合成单元的波形,对这些波形进行编辑拼接后输出。它采用语音编码技术,存储适当的语音基元,合成时,经解码、波形编辑拼接、平滑处理等输出所需的短语、语句或段落。
参数合成法
参数合成法也称为分析合成法。
参数合成法有:发音器官参数合成和声道模型参数合成。
发音器官参数合成法:
是对人的发音过程直接进行模拟。它定义了唇、舌、声带的相关参数,如唇开口度、舌高度、舌位置、声带张力等,由发音参数估计声道截面积函数,进而计算声波。
缺点:合成语音的质量不理想。
参数合成方法的优点:音库一般较小,并且整个系统能适应的韵律特征的范围较宽,这类合成器比特率低,音质适中。
缺点:算法复杂,参数多,并且在压缩比较大时,信息丢失亦大,合成出的语音总是不够自然、清晰。
为了改善音质,近几年发展了混合编码技术,以改善激励信号的质量。
规则合成法
规则合成方法:一种高级的合成方法,通过语音学规则产生语音,可以合成无限词汇的语句。合成的词汇表不是事先确定,系统中存储的是最小的语音单位的声学参数,以及由音素组成音节、由音节组成词、由词组成句子和控制音调、轻重音等韵律的各种规则。
算法中,用于波形拼接和韵律控制的较有代表性的算法是基音同步叠加PSOLA技术。
规则合成法
基音同步叠加PSOLA技术主要特点:
在语音波形片断拼接之前,首先根据语义,用PSOLA算法对拼接单元的韵律特征进行调整,使合成波形既保持了原始语音基元的主要音段特征,又使拼接单元的韵律特征符合语义,从而获得很高的可懂度和自然度。
项目
波形合成方式
参数合成方式
按规则合成方式
语音
质量
可懂度



自然度



词汇量
小(500字以下)
大(数千字)
无限
合成方法
PCM,ADPCM
LPC,LSP,共振峰
LPC,LSP共振峰
数码率
~64kbit/s
~ kbit/s
50~75 kbit/s
1兆比特可合成的语音长度
15秒~100秒
100秒~7分
无限
合成基元
音节、词组、句子
音节、词组、句子
音素、双音素、音节
装置
简单
比较复杂
复杂
硬件主体
存储器
存储器和处理器
处理器
三种语音合成方式的比较