文档介绍:要摘韵钟械囊恍┚浞ǚ治鏊惴ê湍P徒辛吮冉稀⒆酆稀T谧芙崆叭搜芯砍晒幕随着计算机和的推广应用,由数据处理、信息处理发展到知识处理,对语言文字处理要求的深度和广度越来越高。汉语句法分析是中文信息处理领域内的一个重要课题,它的发展能带动其它相关语言学应用的发展。汉语作为自然语言的一种,具有自然语言所共有的最本质的特征,因此汉语句法分析有必要借鉴和吸收成熟的语言学理论。同时,由于汉语的特殊性,决定了汉语句法分析不可能照搬现成的方法,必须从汉语自身特点出发,以先进的语言学理论为指导,研究和开发适合汉语的句法分析技术。本文的核心工作可以概括为以下三个方面:上,对传统的汉语句法分析算法加以改进,采用了自底向上与自顶向下相结合的线图分析方法,提高了分析效率,也使得分析结果的准确率有一定的提高。设计了一套常用的汉语句型库作为研究基础,根据实际应用,确定了一套词性标记集和短语标记集,并根据常用的句型,设计了一套基于上下文无关的语法规则库。治觥⑸杓坪褪迪至艘桓龊河锞浞ǚ治鲈拖低常迪至嘶谧畲蟠食てヅ渌惴ǖ分词模块和基于相对频率训练的统计方法的词性标注模块迪至嘶诟慕南咄挤治鏊法的句法分析模块。本文使用北大计算语言研究所制作的嗣袢毡ū曜⒂锪峡庾魑Q盗费荆荼文确定的词性标记集和短语标记集,以及本文设计的一套语法规则库,使用开发工具,实现了一个汉语句法分析原型系统,并进行小规模中文文本试验测试,验证本文改进的分析算法可行有效。关键词:文本信息处理;汉语句法分析;线图分析法;句法解析器;
知识水坝为您整理
咖甌瑂.’.朱国华:文本信息处理中汉语句法分析方法研究.;,甅,,琣瓵琻’瓸,,,猻瑃’,,,.籔’瑃.Ⅱ
知识水坝为您整理
篢大连理工大学硕士研究生学位论文籗鵆;;
独创性说明作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他入已经发表或撰写的研究成果,也不包含为获得大连理工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。作者签名:日期:≯巧.,如
肆绋经侥辍A暝隆V髁⑷大连理工大学学位论文版权使用授权书容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论作者签名:导师签名:本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内文。大连理工大学硕士研究生学位论文
髀问题的提出特点。自然语言理解的研究不仅仅是一种方法和工具,而且对我们了解人类语言的奥秘、需要以自然语言作为社会交际工具,一旦基于网络的自然语言处理问题得到突破,网络社的理论基础日趋成熟,应用范围也越来越广,初步形成了面向各种不同应用和研究的技术汉语的特点研究。目前,汉语主要按照词、句子和篇章三个层次来开展研究,其中句子的次,经过长时间的发展和不断改进,这类方法已较为成熟,应用在一些实用化的系统中有语言文字是信息的首要载体。我们日常工作中的信息,绝大部分是以语言文字表达、记载、传播和交换的。语言现象看似简单,实际上却反映了人类智慧中最复杂也最本质的开启人类的智慧之门有着重要的影响。因此,随着计算机和畉的推广应用,由数据处理、信息处理发展到知识处理,对语言文字处理要求的深度和广度越来越高。可以认为,一个和处理量基本上代表了这个国家进入信息社会的程度,其语言文字信息的处理能力直接关系到它在网络社会和网络经济中的国际竞争能力。目前,网络社会和网络经济正以我们难以预料的速度在全世界发展,其阻碍发展的首要瓶颈问题就是自然语言的处理问题。网络社会也是人类社会,网络经济也是人类经济,会和网络经济将会突飞猛进自然语言理解是人工智能的一个研究分支,经过几十年的研究,计算机处理自然语言体系。句法分析在自然语言处理领域中具有十分重要的地位,同时它也是公认的一个研究难题。汉语不同与其他西方语言,有许多特殊之处,吸收其它语言研究成果的时候需要结合处理在三个层次中具有承上启下的作用,所以句子处理是一个中心课题。就目前来说,句子处理以自动分词为基础,以句法分析和语义分析为核心。目前国内很多有代表性的句法分析系统的汉语句法分析模块都是通过改进已有的经典句法分析算法设计的,不少己在实践中取得了很好的效果T谡庵屑洌车幕诠嬖的方法又占了主导地位。这是因为基于规则的方法从汉语句子最本质的特征出发,例如构词法、词组构造法、造句法等,从宏观上总结出句法规则。无论汉语的旬式结构多么自由,其中蕴涵的最基本的规则是相对稳定的。规