1 / 65
文档名称:

基于隐马尔可夫模型的说话人转换研究(可复制论文).pdf

格式:pdf   页数:65
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

基于隐马尔可夫模型的说话人转换研究(可复制论文).pdf

上传人:mkt365 2013/11/12 文件大小:0 KB

下载得到文件列表

基于隐马尔可夫模型的说话人转换研究(可复制论文).pdf

文档介绍

文档介绍:摘要近年来随着语音合成技术的不断发展,计算机合成语音的音质和自然度都有了明显的提高。用户也对语音合成也提出了更高的要求——多样化的语音合成,包括多个发音人、多种发音风格、多语种的合成等。目前在语音合成领域,为了满足这种多样化的要求通常采用自适应的方法进行说话人的转换,根据少量的目目标发音人相似的语音。为此,本文对基于隐马尔可夫模型论文第一章主要概述了本文的研究背景和说话人转换技术相关概念与方法。首先介绍了近几十年来语音技术的发展情况,然后简要分析了现有的几种常见的说话人转换方法,包括基本的思想、实现方法和优缺点等。论文第三章主要讨论针对极少量目标数据时的本征语音模型自音人模型,由最大似然准则进行模型加权的方法来实现说话人的转换。实验验证荚蚶锤纳果的改善,最后通过实验总结了现有自适应方法的效率与性能表现。应,介绍了基于目缬镏肿允视Ψ椒ǎ⑼ü笛檠芯苛酥杏⑽目缬镏肿关键词:隐马尔可夫模型、说话人转换、本征语音、最大后验概率、跨语种自适标说话人的数据,采用一定的方法对源说话人的语音参数进行调整,进而得到与的说话人转换技术进行了详细的介绍,为改善不同情况下说话人转换的效果进行了相应的研究。论文第二章主要介绍了目前最为常用的基于P偷乃祷叭俗;换框架。包括铣上低车牧鞒蹋丶际醯悖约跋衷谧畛S玫淖畲笏迫幌性回归允视Ψ椒ǎ1疚脑谒祷人转换方面的工作做基础和铺垫。适应方法,为了改善在极少量数据时的说话人自适应效果,主要通过建立多个发了仅有凡句话时该方法相比自适应可以取得更好的效果。论文第四章主要结合最大后验概率现有的说话人转换效果。首先分析了峁够疢然痉椒ǎ然后通过、鹊南低呈笛檠橹ち私岷螹准则后自适应效论文第五章是针对跨语种的说话人自适应研究。主要是中英文的跨语种自适适应的效果。应
知识水坝***@pologoogle为您整理
鋌,琒瑆篐,,.琒琫...産,,,,。,,疭甌,,琤琣..
知识水坝***@pologoogle为您整理
阥月乡日作者签名:,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。本人授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。保密的学位论文在解密后也遵守此规定。
第一章绪论语音技术与发展语音是人与人之间进行交流和沟通的一种最自然和方便的方式。随着计算机科学、数字信号处理以及人工智能技术等学科的发展,人们也希望计算机能够和人类一样具有听说读写的能力,可以通过语音和计算机进行信息的交互。对于不同语音之间可以利用机器翻译技术进行相互理解和沟通。在最近的几十年中,在以上需求的驱动下,具有不同学科背景的科学家与工程师们不约而同地加入了这一研究的行列,新的理论和方法越来越多的涌现。其中语音编码、语音识别和语音合成是目前在语音处理技术中最为重要的三个研究方向。.镆艏际醯姆⒄语音编码是目前语音技术中最重要的实际应用。数字化的语音传输和存储,在可靠性,抗干扰性,保密性和价格等方面都远胜于模拟语音。从年法国最早推出脉冲编码调制J迹诖笤疾坏甑氖间里,随着计算机科学以及大规模、超大规模集成电路技术的发展,语音编码取得了非常大的进步。新的语音编码算法也在不断出现,如珹珹,珻琈,等。从最早的语音编码系统速率为的ㄐ伪嗦肟J迹搅甏衅诘乃俾饰的波形与参数混合编码器,在语音质量上已经非常接近前者的水平,并进入了实用阶段。、语音编解码协议在无线通信、缁暗攘煊蛞惨丫辛斯惴旱挠τ谩语音识别的研究起步稍晚,大约从五十年代开始,大规模的研究开始于七十年代初期。经过年的发展,从最早期的元音识别,到特定人、小词汇量、孤立词的识别,再到现在非特定人、大词汇量、连续语音识别,语音识别技术逐渐发展和成熟起来。在语音识别的发展过程中,起主要作用的是腂【和的,他们将一种统计模型——隐马尔可夫模型引入到语音识别研究中,在很大程度上提高了语音识别系统的性能。语音识别系统早在几年前就已经开始投放市场,比如腣以达到%左右的识别率。语音识别是机器理解,人机语音通信的基础。随着语音识别技术的进一步发展,必将有性能更加优良的系统出现和应用。语音合成是语音技术的另一个重要组成部分,是语音技术中研究起步最早的工程师
.镆艉铣杉际跫蚪部分而且也是研究比较不充分的部分。它不仅在人机交互中充当非常重要的角色,而且对语音的产生和模型等基础理论的研究也有十分重要的意义。从活控制的数字式合成器,语音合成的研究已有嗄甑