1 / 63
文档名称:

藏语依存树库的构建.pdf

格式:pdf   页数:63页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

藏语依存树库的构建.pdf

上传人:ds6573 2015/12/6 文件大小:0 KB

下载得到文件列表

藏语依存树库的构建.pdf

文档介绍

文档介绍:分类号密级公开
U D C 学号 20100813001

青海师范大学
硕士学位论文

༄༅།།བོད་སྐད་ཀྱི་བརྟེན་གནས་སོང་འགྟེམ་ཚིག་མཛོད་བཟོ་བའྱི་ལག་རྩལ་ཞྱིབ་འཇུག
《藏语依存树库的构建》

研究生姓名头旦才让
导师姓名(职称) 才让加, 教授
申请学位类别硕士申请学位名称理学
学科专业名称计算机应用技术
研究方向名称藏语计算语言学与机器翻译
论文提交日期 2013 年 4 月论文答辩日期 2013 年 5 月
学位授予单位青海师范大学学位授予日期 2013 年 6 月
答辩委员会主席
评阅人,


万方数据
青海师范大学学位论文独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究
工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的
地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包
含为获得青海师范大学或其它教育机构的学位或证书而使用过的材
料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了
明确的说明并表示了谢意。


研究生签名: 日期:




海师范大学学位论文使用授权声明
青海师范大学、中国科学技术信息研究所、国家图书馆有权保
留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或
其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一
致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布
(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权
由青海师范大学研究生部办理。

研究生签名: 导师签名: 日期


万方数据
藏语依存树库的构建
中文摘要
句法分析是整个自然语言处理过程中很重要的一个环节,在句法分析领域,
人们一般采用树库作为获得句法知识和评价句法分析器性能的资源。藏语依存树
库构建技术可以为基于统计的藏语自动句法分析器提供必要的训练数据和统一
的测评平台,而且能为藏语句法学研究者提供真实的文本标注素材,便于语言学
家从中总结语言规律,也是进一步进行句子内部的词语义项和语义关系标注的基
础。
藏语依存树库的构建不但是藏文信息处理领域的一项很重要的研究工作,也
是自然语言处理研究中的关键技术之一,通过构建藏语依存树库可以为藏文信息
处理、藏语语言研究和藏语语料库语言学等研究领域提供重要的语言数据资源和
研究平台,对推动藏文信息处理研究具有重要的意义。
本文通过收集整理 1000 句藏语分词标注语料,进行了藏语依存树库构建技
术和方法的研究;介绍了依存语法的基本概念、依存关系解析、藏语句法分析引
入依存语法的目的等;制定了藏语依存句法标注规范和标记,大类为 5 种,小类
为 36 种;通过依存树库构建方法的研究,设计实现了藏语依存句法标注工具;
对藏语依存句法树进行了较为详尽的分析;以藏语依存句法标注规范作为依存关
系的标注依据,利用藏语依存句法标注工具作为辅助软件建立了规模为 1000 句、
词语总数为 11951 个、平均句长为 12 个词的藏语依存树库;并对建立的藏语依
存树库进行了词类分布统计。

关键字:藏语,语料库,依存树库,依存语法,句法标注
I

万方数据
བོད་སྐད་ཀྱི་བརྟེན་གནས་སོང་འགྟེམ་ཚིག་མཛོད་བཟོ་བའྱི་ལག་རྩལ་ཞྱིབ་འཇུག
ནང་དོན་གནད་བསྡུས།
ཚིག་གྱི་རྣམ་བཞག་ལ་དབྟེ་ཞྱིབ་བྟེད་པ་ནྱི་རང་བྱུང་སྐད་བརྡ་སྱིག་གཅོད་ཁོད་ཀྱི་ལག་རྩལ་གལ་ཆྟེན་ཞྱིག་
ཡྱིན་ལ།མྱི་རྣམས་ཀྱིས་རྒྱུན་པར་སོང་འགྟེམ་ཚིག་མཛོད་བཀོལ་ནས་ཚིག་གྱི་རྣམ་བཞག་ལ་དབྟེ་ཞྱིབ་བྟེད་
བཞྱིན་ཡོད་པ་དང་།བོད་སྐད་ཀྱི་བརྟེན་གནས་སོང་འགྟེམ་ཚིག་མཛོད་ཀྱིས་བསོམས་རྩྱིས་གཞྱི་བས་པའྱི་བོད་
སྐད་ཀྱི་ཚིག་གྱི་རྣམ་བཞག་དབྟེ་ཞྱིབ་བྟེད་ཆས་ལ་དགོས་ངྟེས་ཀྱི་གཞྱི་འཛིན་གངས་དང་གཅྱིག་གྱུར་གྱི་ཚོད་
ལྟའྱི་ཐོན་ཁུངས་མཁོ་འདོན་བྟེད་ཐུབ་པས་དྟེས་མ་འོངས་པའྱི