1 / 15
文档名称:

基于树库汉语依存句法分析.doc

格式:doc   大小:32KB   页数:15页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于树库汉语依存句法分析.doc

上传人:sanshengyuanting 2021/1/12 文件大小:32 KB

下载得到文件列表

基于树库汉语依存句法分析.doc

文档介绍

文档介绍:基于树库的汉语依存句法分析
第22卷第1期
2009年2月
模式识别与人工智能
PR&AI

Fleb2oo9
基于树库的汉语依存句法分析
刘海涛赵怿怡
(中国传媒大学应用语言学研究所北京100024)

,找出影响句法分析精度的主要因素,并据此对树库中处理
,
明,%,%. 关键词依存句法分析,树库,中文信息处理,标注体系,语料库语言学
中图法分类号TP391
ChineseDependencyParsingBasedonTreebank LIUHai-Tao,ZHAOYi—Yi
(InstituteofAppliedLinguistics,CommunicationUniversityofChina,Belling100024)
ABSTRACT
Aimingatexploringthepossibilityofincreasingtheparsingaccuracybylinguisticmeans,an
experimentofChinesedependencyparsingisconductedbyusingMaltParserandaself-buiht
reebank.
Throughthedetailedanalysisfortheparsingresults,thepossiblesuggestionaboutimproving
the
performanceoftheparserisprovidedanditisusedastheguidancetomodifytheannotationsch
emeof

ntscore
%.%.
KeyWordsDependencyParsing,Treebank,ChineseInformationProcessing,AnnotationSc
heme,
CorpusLinguistics
引言
基于句法标注语料库和机器学****的自然语言处
理方法是当前自然语言处理领域中的一个研究热
,人们一般采用经过句法标注的
语料库(也称为树库)来作为获得句法知识的资源
和评价句法分析结果的工具….一般的做法是通过
改变机器学****策略,句法分析算法来改善句法分析
,由此产生了
"语言学背景的计算语言学研究者在基于树库的语
收稿日期:2008—02—21
作者简介刘海涛,男,1962年生,教授,博士生导师,主要研究方向为计算语言学,依存句法,-mail:lhtcuc@
,女,1982年生,博士研究生,主要研究方向为依存句法分析. 模式识别与人工智能22卷
言信息处理研究中可以做些什么?","能用语言学
的手段来提高此类句法分析器的精度吗?"等问题.
本文试图在机器学****策略和句法分析算法不变的情
况下,通过改变树库的标注方式来探讨这个问题.
,现
代依存语法的创立者为法国语言学家Tesni~re2J,
有关依存语法以及该理论和计算语言学的关系,可 参见文献[3]~[5].
依存句法分析的目标是构建输入句子的依存句 法结构树(图).图1为句子"这是一个例子"的依存 句法结构图.
这是
rV

个例子
mqn
图1"这是一个例子"的依存句法结构图
"Thisisan
example"
图1显示,构成依存树(图)的基本单位是二元 依存关系,这种关系可以在两个词之问形成,也可以 将其抽象为一种两个词类标记(PartofSpeech,
POS) 称关系,即在两个词(类)中有一个为支配词,图1 中弧上的箭头表示了这种有向性.