1 / 92
文档名称:

基于隐马尔可夫模型的说话人转换方法的相关研究(可复制论文).pdf

格式:pdf   页数:92
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于隐马尔可夫模型的说话人转换方法的相关研究(可复制论文).pdf

上传人:mkt365 2013/11/12 文件大小:0 KB

下载得到文件列表

基于隐马尔可夫模型的说话人转换方法的相关研究(可复制论文).pdf

文档介绍

文档介绍:摘要提高,因此,用户对语音合成系统提出了更高的要求——多样化的语音合随着目前语音合成技术的进步,合成语音的音质和自然度都有了很大的成,包括多个发音人、多种发音风格、多种情感以及多语种等语音的合成。在这一背景下,通过调整一个说话人的语音,使其听起来像是另一个人说出来一样的说话人转换技术被提出。说话人转换技术根据少量的目标说话人的语音数据,对源说话人的语音参数进行调整,从而得到目标说话人的合成语音,并可以此实现多样化的语音合成。为此,本文对基于的说话人转换技术进行了详细的介绍,并对其训练流程和关键技术进行了改进,最后,针对具体的应用进行了相应的研究。本文按照如下几个部分展开讨论:文章的第一部分主要是介绍了本文研究的背景和几种主要的说话人转换的方法。首先,简单的描述了一下语音合成技术以及其近年来的发展。接下来,为了帮助我们更好的理解说话人转换的原理,我们也对人的发音过程的声学机理和数学模型进行了系统介绍。这是因为,说话人转换技术是对源说话人的音色进行转换使其听起来像目标说话人发出的。而为了实现说话人音色的转换,通常需要对语音信号进行激励源和声道滤波器的分离,以便对激励信号和声道模型分别进行修改,然后再重新生成语音。最后我们对说话人转换技术的发展和常用的几种方法进行简要的介绍。由于基于乃祷叭俗;患际跏墙⒃诨贖的语音合成系统的基础上的,因此,本章首先介绍了甋的基本框架,并对其中的一些关键技术进行了分析。接下来主要介绍了基于说话人转换技术的一个重要环节一一P妥允视λ惴ā0∕惴ㄖ蠬模型均值和方差转换矩阵的估计方法以及回归矩阵绑定的基本原理。最后基于上述基于的说话人转换的基本框架,进行了女到女和女到男的说话人转换实验,并且从合成语音的音质、自然度以及与目标语音的相似程度三个方面进行了主观和客观的评测实验。在文章的第二部分,主要介绍了基于乃祷叭俗;坏幕究蚣堋
知识水坝***@pologoogle为您整理
文章的第三部分针对第二章中所介绍的基于乃祷叭俗;坏母髦要技术环节,如基于畇籋基频建模的模型自适应、时长模型的自适应、源说话人模型的训练和选择、模型自适应算法、考虑动态参数的参数生成算法等模块;以及合成语音中的问题,如在自适应数据很少时效果不佳、合成语音频谱过于平滑等问题,分别进行了分析和相应的改进工作。主要的改进包括:整合了自适应流程,使频谱、基频、时长模型在相同的框架下进行转换;使用参数减轻频谱过平滑的问题:使用共享决策树聚类方法训练平均模型作为源说话人模型,从而提高模型自适应的鲁棒性;对模型自适应算法进行改进,提高自适应效果;针对不同的训练数据量,采用不同类型的转换矩阵;改进参数生成算法。文章的第四部分主要介绍了基于乃祷叭俗;患际踉谇楦杏镆艉成以及嵌入式的多说话人语音合成系统方面的应用。提出了基于那感语音合成方法。并通过主客观的测试验证了情感语音合成的有效性。另的方法。关键词说话人转换、隐马尔可夫模型、可训练语音合成、模型自适应外,针对嵌入式系统中资源受限的特点,提出了一种实现多说话人语音合成
知识水坝***@pologoogle为您整理
一産猙。.瑃,..,.瓺,.甀,..甌..,瑆.
瓼..,,.,.甌,琺簦
作者签名:每艺瓿г中国科学技术大学学位论文相关声明何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究校有权按有关规定向国家有关部门或机构送交论文的复印件和电子本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任所做的贡献均已在论文中作了明确的说明。本人授权中国科学技术大学拥有学位论文的部分使用权,即:学版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。保密的学位论文在解密后也遵守此规定。
,计算机已成为人类不可缺少的日常工具。在计算机中,通常人机交互界面以键盘为主。为了使计算机的界面更加“友好”,科学家开发出了若干种易学易懂、操作简单的界面,其中最方便最自然的界面首推口述语言。基于语音识别、语音合成及自然语言理解的人机语音对话技术是世界公认的一个难度很大,极富挑战性的高技术领域,它的前景十分光明。领导世界软件潮流的美国微软公司的创始人比尔盖茨先生曾说过,“在不久的将来,%的网络软件将是在语音驱动下完成的。”近几年来,语音识别、合成技术发展很快,和它有关的语言学、语音学、语音理解,听觉心理和语言感知也有较大进展。同时超大规模集成电路、电子计算机、数字信号处理、人工智能等取得了突飞猛进的发展,以及最近两年的国际互联网的迅速生长和全球信息基础设施建设热潮,这些都为人机语音对话的研究提供了更好的理论和物质基础以及需求牵引。作为人机交