1 / 76
文档名称:

汉语句法分析方法研究.pdf

格式:pdf   页数:76页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

汉语句法分析方法研究.pdf

上传人:你是我的全部 2015/9/11 文件大小:0 KB

下载得到文件列表

汉语句法分析方法研究.pdf

文档介绍

文档介绍:中国科学院研究生院硕士学位论文�分类号�指导教师塞盛迭盟壅虽生国抖堂暄自塾丝盟究逝申请学位级别王堂亟±学科专业名称撞式迟型:生蟹篮丕统论义提交日期星�墨箜墨旦论文答辩曰期����ǖ�生国型堂院自麴丝婴童逝主国型堂瞳堑塞生院����李幸学位授予单位答辩委员会主席培养单位编号密级��
摘要算法的一个改进算法——“角色反演算法”。针对该算法,本文在两方面提出进一步的改进。首先改进了算法中采用的静态数据表的构造方法,使得该算法能处理的原始输入词性标记从最小的句法单元——词,扩展到更高一级的句法单元——短语和句子,以很小的额外空间消耗为代价,提高了算法的处理能力和效率。然后,引入规则的概率信息对静态表排序,有利于后续分析的搜索和剪枝过程。句法分析是自然语言处理中的关键性问题之一,其主要任务就是自动识别句子的句法结构,即句子包含的句法单位以及这些句法单位相互之间的关系。句法分析问题的解决对于机器翻译、自然语言理解、信息抽取和自动文摘等自然语言处理系统都有着极其重要的意义。在基于统计的句法分析方法中,最关键的两个问题是句法分析算法和歧义消解模型的设计,他们决定着句法分析系统的效率和分析正确率。本文从事的工作则从这些方面入手,实现了一个高效的中文句法分析器,主要研究工作如下:��诰浞ǚ治鏊惴ǚ矫妫�源�车木浞ǚ治鏊惴ù哟�聿呗裕�惴ǖ氖奔�和空间复杂度等方面进行了综合分析和比较。并在此基础上,详细研究了����攵愿丛映ぱ�浞ǚ治龅睦�眩�ü�治霰甑惴�旁诔ぱ�钩缮系淖饔�和规律,针对长旬提出了一种分层的句法分析方法。该方法把标点符号分为分割标点和普通标点两类,根据分割标点将复杂长旬分割为句子单元序列独立进行第一级分析,然后把第一级分析得到的结果作为第二级分析的输入,最终输出结果为完整的句法分析树。另外,通过提取含有所有两类标点符号的文法规则,在一定程度上帮助了句法结构歧义的消解。实验证明该算法大大降低了长句分析的时恻复杂度,并且比传统的一遍搜索方法的正确率和召回率均提高了�ァ���谄缫逑�饽P头矫妫�诖�车母怕噬舷挛奈薰匚姆����P偷幕�础上,提出了一个包古内部成分结构信息的��模型,并进一步引入中心词信息,得到包古内部结构成分信息和中心词信息的词汇化��模型。并且,本文提出了根据内部成分结构标记确定中心词的方法,此方法比传统的中心词确定方法具有更高的『�沸院椭惫坌浴�
雝����芿�����瞕��������恚瑃����瞓�����綽���綼���.����疌��������������⑴羥��謈����������篸���培趴�印�������.��������������閏���也����適�閏����衔��籵��鹊�秂����.��‘�����·��痵�砒����谪�����������������������甴’�������������������,������������甀����瑃�����:������������,���.��也�����.����縪�:�����,����畆�������眞����鮨�������驜��������瓼���,������,���騦�����.���瑃������.�����瑃���也����,������鰁�甀������瑃�������盯��仃������‘���’‘����’��.�‘����痯���������瑂���猻������畇���������.�����痑�����瓻�����
珊����商���������������瑃���穐��出��琣�也��ヒ詌��������瞖��趖,�����撕����������������,���甀��������,�������!鎒���.���Ⅱ������.������瓵����瑆���
蛳良独创性声明关于论文使用授权的说明日期:丝堕.��≯一���⒎�本人声明所成交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确地说明并表示了谢意。签名导师签名:本人完全了解中国科学院自动化研究所有关保留、使用学位论文的规定,即:中国科学院自动化研究所有权保留送交论文的复印件,允许论文被查阅和借阅:可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。�C艿穆畚脑诮饷芎笥ψ袷卮斯娑�导师签名期:日
第一章绪言��引言��句法分析的任务和目标分析结果的好坏直接影响到对自然语言句子的理解。而自然语言理解又是机器翻定性造成了自然语言句法歧义现织的普遍存在,歧义消解问题成为句法分析的主得无论从排歧方法、分析精度,还是从时间、空间复杂度上,自动句法分析都面析结果的正确率。