文档介绍:摘要韵律控制是语音合成系统中十分重要的一个模块,本论文研究了多语种语音合成中的韵律建模,提山并实现了一种中英文、混读的韵律建模框架。一般对单语种语音合成的韵律生成有三种,基丁先验规则的韵律生成、基丁数据驱动的韵律生成和基丁参数模型的韵律生成。论文详细研究了汉语中这三种类型的韵律生成方法及优缺点。ü院河镉镆粞Ш陀镅匝У难芯孔芙嵋恍┩ǜ盏脑下晒嬖颍ㄕ庑┳ḿ知识,可以建立一个规则韵律生成系统。通常规则系统包括两个方面:一是汉语语言通规则;二是日标说话人的特定韵律特征规则。这种方法有效的利州了专家知识,但是韵律产生的复杂度远远人丁现在已经掌握的人汗嬖颍绕涫翘囟ㄓ镅曰肪澈吞囟ㄈ朔⒁舻囊恍┫则。孀湃擞锪峡庵谱骷际醯纳较郑约凹扑慊彩布际醯姆⒄鼓陓恍└咝У幕餮算法的成熟,使得录制人规模的语料库,圳数据驱动的方法进行机器学习来发掘其中的韵律规则成为一个可能。数据驱动的方法。可以尽可能的利已有的语料资源,自动化的机器学习可以发摭更多更细的规则,对不同的数据库做快速的白适应,人人降低研究者的烦杂的分析鹤鳌5鞘萸话阋G蟊冉先饲揖獾氖菘猓已盗纺P兔挥泻陀镅蕴卣饔餓入的感知直接建立联系,无法进行转移平¨调整。问P屠ㄏ妊橹J叮确治龌凳盞阬语言特征、人的听感的关系,。这样的模型有效利川了专家知识,就可以不多的数据训练山文本语言特征和参数的关系,同时通过调整模删参数就可以达剑改变听感的韵律特征的目的。论文中分别讨论实现了模酗、模型和g樵谥形脑下缮系穆橹菅芯俊多语种的合成系统的一个主要问题米源丁煌镅杂胁煌脑下商逑到峁埂6远《嘤镏混读合成的韵律模耻设计的就是要建立一个多韵律的统一的框架,使得在这个框架描述不同语言有相同的一些特征体现,同时也可对并白不同特征进行分别建模。本论文主要研究了中英文混读的韵律建模。汉语属丁有调语言,韵律模型要专门针对调形进行描述:英语是无调语言,模型土要对英文重音进行描述。通过设计一个中英文混读的实验,研究表明,汉语说话人的混读朗读中英文受中文的影响明显,音高上升、’惚涠福欢形氖苡文的影响比较小。以植愕幽P臀?蚣埽杓浦杏⑽男苟辆哂邢嗤木渥永逃锊悖而有不同的音‘肖层。对各自的音节层形奈猅悖⑽奈狝可以分别建模,再考虑相互作川。。这样中英文的韵律就被有机结合起来,。利这种框架理念,还可以扩展模型,刚丁硐侄嗨祷叭恕⒍嘤锲⒍嗲楦械缺硐至Ψ富的语音韵律。最亓设计了一个公共的韵律评测体系,并结合已完成的洮读韵律模型实现一个基丁腡混读合成系统,实现多韵律模型的主观和客观评测。第彻
知识水坝***@pologoogle为您整理
’.,,.狤猯..琤—甌:甌,琣甌瓵瑆.’琩...痯甿瓹,’,
知识水坝***@pologoogle为您整理
。在合成器中,在台成参数的控制下,再一帧一帧地重新还原语音波形。也复杂一些,合成音质也差一些。比如共振峰合成器、铣善鳌以,合成规则是在分析每一语音单元出现在不同环境中的协同发音效应后,纳其规律而制由人『:制作出语音称为语音合成。语音合成是人机语音通信的一个重要组成部分。语音合成研究的目的是制造一种会说话的机器,它解决的是如何让机器象人那样说活的问题。使一些以其他方式表示或存储的信息能转换为语音,让人们能通过听觉而方便地获得这些信息。语音合成从技术方式讲可分为波形编辑合成、参数分析合成、规则合成三种掠辣騛干夯徽粤。ㄐ伪嗉铣这种方式以语句、短语、词或音节为合成单元,这些单元被分别录音后直接进行数字编码,经适当的数据压缩,组成一个合成语音库:重放时,根据待输出的信息,在语料库中取出相席单元的波形数据,串接或编辑在一起,经解码还原出语音。这种合成方式,也叫录音编辑合成,合成单元越人,合成的自然度越好,系统结构简单,价格低廉,但合成语音的数码率较人,存储鼙也人,冈而合成词汇量有限。在自动报时、根号、报站或报警等装置中,多采朋这种技术。现在流行的人沿料台成系统可以说是这种方法的扩展,采州录制更多、覆盖更挠镆舻ピ:陀行У牡ピL粞〉ピ2呗裕佣铣商囟煊蚰谌我馕谋镜母甙兹欢鹊语音。问治龊铣这种合成方式多以音。胍粜蛞羲匚:铣傻ピ!J紫龋凑沼镆衾砺郏运泻铣单元的语音进行分析,一帧一帧地提取有关语音参数,这些参数经编码后组成一个合成语音库;输山时,根据待合成的语音的信息,从语音库中取出相应的合成参数,经编辑和连接,主要的合成参数有:控制音强的幅度、控制音高的基频和控制音色的共振峰参数。这种方式的数码率比波形编辑式小得多,升且合成时可以自由的按需要调整音高和音色,但系统结构嬖蚝铣这种合成方式通过语音学规则来产生目标语音。规则台成系统存储的是较小的语音单位缫羲亍⑺羲亍卜音节或音:的声学参数,