1 / 6
文档名称:

Research on Dialect Conversion for Chinese Mandarin to Shenyang.pdf

格式:pdf   页数:6页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

Research on Dialect Conversion for Chinese Mandarin to Shenyang.pdf

上传人:策划大师 2011/11/13 文件大小:0 KB

下载得到文件列表

Research on Dialect Conversion for Chinese Mandarin to Shenyang.pdf

文档介绍

文档介绍:汉语普通话与沈阳方言转换的研究*

贾珈 1,蔡莲红 1,李明 1,张帅 2
(1. 清华大学计算机科学与技术系,北京 100084;2. 北京信息科技大学计算机学院, 北京 100101)

文摘:中国地域辽阔,汉语包括多种方言。方言转换技术可实现方言间语音的转换,丰富语音交流的方式,增强语
音交流的可懂性、友好性和趣味性。该文分析了普通话与沈阳方言在声调调类与调值、时长和特殊词等方面的差异;
探讨了普通话与沈阳方言转换的可行性;提出了基于混合聚类算法的方言基频转换模型、基于统计的方言时长转换模
型和基于加权有限状态机的特殊词识别算法;通过基本转换和说话人音色还原构建了方言转换系统,实现了实时普通
话语音输入,沈阳方言语音输出。评测结果显示通过方言转换系统得到的方言语音与目标方言语音具有较高相似度。
关键词:方言转换;基频聚类;时长统计;语音识别;音色还原
中图分类号: TP391

中国地域辽阔,汉语包括多种方言[1-3]。方音节,进一步补充 159 个音节。2)沈阳方言与北
言转换技术可实现方言间语音的转换,丰富语音交京话古音清入声字的调类和调值对应关系研究。
流的方式,增强语音交流的可懂性、友好性和趣味由于沈阳方言中古音清入声字的读音存在特殊变
性。基于基音同步叠加(PSOLA)算法(具体为化,因此录制古音清入声字语料共 358 个单音节。
TD-PSOLA,LP-PSOLA 和 FD-PSOLA 算法)和声音录制时将音节嵌入负载句中朗读,负载句为:“*”
分析变换合成算法(STRAIGHT) [4-6],可以实现语说“*”这个“*”(*为音节),以消除句中位置对
音时域、频域声学特征的控制修改,为方言转换提发音的影响。
供了技术基础。本文分析了普通话与沈阳方言在声双音节语料用于进行方言声调换转的建模,
调的调类与调值、时长和特殊词等方面的差异;探共录制 488 个双音节词语,包含特殊变调和变音。
讨了普通话与沈阳方言转换的可行性;提出了基于短句语料用于进行方言时长分析。本文从
混合聚类算法的方言基频转换模型、基于统计的方 1998 年 1 月《人民日报》版语料中共选取 23 句
言时长转换模型和基于加权有限状态机的特殊词短句,每句长度为 10 至 25 音节。
识别算法;通过基本转换和说话人音色还原,构建录制者为在沈阳出生并在沈阳生活 18 年的
了普通话到沈阳方言的转换系统,实现了实时普通男性朗读者一名和女性朗读者一名。并录制了同
话语音输入,沈阳方言语音输出。评测结果显示通文本的普通话语料。每名朗读者朗读 2 遍语料。
过本文提出的方言转换系统得到的方言语音与目 普通话与沈阳方言差异分析
标方言语音具有较好相似性。 声调的调类与调值的差异
方言语音声调的调类和调值分析,采用《方
1 普通话与沈阳方言差异分析
言调查字表》[7]正表之前第一页的声调代表字
为了实现普通话与沈阳方言的转换,本文首审辨调类调值。本文录制了声调代表字的音共
先研究普通话与沈阳方言的调类调值、时长和特 241 个。提取录音的基频曲线,通过聚类审辨方
殊词等方面的差异。言的调类、调值。普通话与沈阳方言的调类调值
分析语料差异以五度