1 / 64
文档名称:

维吾尔语语音语料库管理系统的设计与实现.pdf

格式:pdf   页数:64页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

维吾尔语语音语料库管理系统的设计与实现.pdf

上传人:coconut 2014/2/26 文件大小:0 KB

下载得到文件列表

维吾尔语语音语料库管理系统的设计与实现.pdf

文档介绍

文档介绍:北京工业大学
硕士学位论文
维吾尔语语音语料库管理系统的设计与实现
姓名:热依曼·吐尔逊
申请学位级别:硕士
专业:软件工程
指导教师:石宇良;吾守尔·斯拉木
20090401
摘要管理语音数据库。本语音语料管理系统实现了维吾尔语现代文字到拉丁文字的转换,浏览,更新,查询发音人信息,播放等功能模块关键技术。语音语料库;拉丁文;代码转换随着信息社会和计算机科学的发展,语音信息服务得到了广泛的应用。语音语料库在语音分析、语音识别和语音合成等语言科学研究及技术应用中,作为一种自’效而不可缺的研究手段,发挥着不可替代的作用。高质量、大规模、多样化的语音数据库对于推动语音识别和语音合成技术的研究和应用具有重要意义。因此,建立高质量的语音数据库是这一领域的关键性课题。设计维吾尔语语音语料库管理系统的目的在于使维吾尔语语言的声音永久而系统地保存下来,并能使国内外语言学****研究者方便地进行大规模语音资料的查询、浏览、播放、现代维吾尔文到拉丁文之间的转换和拉丁文到现代维吾尔文的转换。为维吾尔语自然语言处理提供了一个有利的工具。由于维吾尔语的特殊的书写特征、维吾尔语语料库的设计及建库过程中遇到的难点与汉语或非维吾尔语语言语音数据库有所不同。本文着重研究了语音语料库的设计和有效的管理技术的实现问题。重点介绍了维吾尔语音语料库管理系统的实现过程;具体解决了如下关键技术:根据维吾尔语的语音和语言特征,解决了音节划分等有关文本分析的关键问题,并总结了重音、停顿等韵律规则。占谋荆晕谋窘姓怼⑿6裕缓蠓殖删渥樱扛鼍渥影个单词。玫谌教峁┑腡词迪只赨字符的维吾尔语双向文字的转换。⒘税龇⒁ü锪峡夤芾硐统,将语音的文字描述缥岫摹⒗∥与语音数据有机的结合起来综合关键词:维吾尔语;
,,琩甀,琣’;籆..。.北京等搜程硕貉宦畚瑃瓸,.,琓,:,,瑆】琾猵,Ⅱ
扮杀喻眶签名:撞被嗍坦啦彳躲黝及炎导师繇独创性声明关于论文使用授权的说明究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研已在论文中作了明确的说明并表示了谢意。保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。
第绪论引言语音语料库的国内外发展现状曼量曼皇曼皇曼璺曼曼皇曼鼍曼曼皇曼皇皇曼曼曼皇曼罾皇曼皇曼皇皇曼皇曼事事曼曼曼曼曼的好坏直接影响到合成语音的质引乙语音是人类最方便快捷的交际手段。通过语音实现人机互交,已成为信息技是指包括有可能利用来发现和研究语言学和语音学知识的一切素卡才А6锪峡是指为某一目的而录制的语音信号及其标注的集合。现在已经成为语音研究和语料库技术的支持,语音学家通过对大量语料库数据的统计、分析,可以更方便地技术重点实验室一直很重视对它的研究与建设。近年来,在语言信息处理的研究和开发中,单语和多语语料库运镉锪库居多淖饔萌找嫦猿隼础L乇鹗窃诨谟锪峡獾挠镅孕畔⒋硌芯恐校嗣提出了多种基于语料库的新方法,例如采用所谓的基于实例—的或基于存储畒的机器翻译方法,可以直接使用经过对齐术研究和发展的主要趋势之一。而语料是进行语音识别、语音合成的起点。语料音工程中不可缺的重要技术手段和工具乜K淙淮蠖嗍硕哉庖桓拍罨共皇煜ぃ但实际上它已经被应用在日常生活中的很多领域。例如公交车上的自动报站系统、车站和机场的自动车次与航班播报等,都使用了语音语料库技术。在这些系统中,人们听到的那些甜美的声音,并不是真人播报的,而是利用事先录好的语音库数据,使用语音合成虺芓,即际跏凳焙铣刹シ懦隼的。基于语料库的语音合成方法中语料库扮演者非常重要的角色,可以说语料库不仅语音合成领域,在语音识别中,语音语料库也是必不可少的。现在手机的语音拨号功能,镜腣砑约拔⑷砉驹谛掳鎃屑傻通过语音输入文字的功能都属于语音识别的范畴。除了上述语音合成和语音识别等工程领域,现代语音学各个领域的理论研究也无不依赖语音语料库的支持。在以往技术条件不具备的时代,语音学家只能根据“口耳之学心谑∈降奶剿餮芯浚馔遣还豢凸圩既返摹O衷谟辛擞从中发现具有普遍意义的客观规律。基于语音语料库的这种重要地位,新疆大学信息科学与工程学院多语种信息的双语语料库来进行处理。第坌髀..
,建立相关的语音语料库。美国的为非营利组织,其会员遍及世界,建立了各类不同用途的语料库及语