文档介绍:苏州大学学位论文独创性声明期:≯∥·印篲本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研究成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。论文作者签名:
广
/派纠甅删删删』——年一月解密后适用本规定。苏州大学学位论文使用授权声明日期:汐,.產本人完全了解苏州大学关于收集、保存和使用学位论文的规定,即:学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸质论文的内容相一致。苏州大学有权向国家图书馆、中国社科院文献信息情报中心、中国科学技术信息研究所蚍绞莸缱映霭嫔、中国学术期刊馀贪电子杂志社送交本学位论文的复印件和电子文档,允许论文被查阅和借阅,可以采用影印、缩印或其他复制手段保存和汇编学位论文,可以将学位论文的全部或部分内容编入有关数据库进行检索。论文作者签名:导师签名:涉密论文口本学位论文属非涉密论文口
命名实体与基本名词短语识别研究中文摘要命名实体识别任务是确定文档中的人名、地名和机构名等文本片段及其类型的过程,而基本名词短语识别的目的是找出篇章中非递归、无后修饰成分的名词短语。二者是文本理解的基础步骤,在很大程度上影响着指代消解等自然语言处理系统的性能。指代消解是自然语言处理的重点和难点之一,涉及机器翻译、信息提取等诸多应用,它的解决依赖于命名实体识别、词性标注等相关技术。本文在深入分析命名实体识别和基本名词短语识别现有技术的基础上,以命名实体识别和基本名词短语识别为研究对象,进行了以下几个方面的工作:首先,本文针对部分地名、机构名嵌套其他命名实体结构的特点,采用层叠条件随机域模型来进行命名实体识别。该方法利用底层模型对简单的命名实体进行初步识别,挑选其中若干个最好识别结果传递到高层条件随机域模型中,进一步对复杂地名和组织机构名进行识别,提高命名实体识别的性能。其次,本文对中文基本名词短语识别采用基于错误驱动的层次模型方法,初步提取包含上下文环境信息的原子特征并进行组合,通过实验选定有效特征,再经过训练生成两层结构的组合分类器,与单纯使用一种分类器的结果相比,层次组合策略能有效提高系统性能。最后,本文将命名实体识别和基本名词短语识别的研究结果应用于中文指代消解平台,通过对预处理环节中命名实体识别和基本名词短语识别模块的改进,在形挠锪仙系氖笛榻峁砻鳎苡行岣咧形闹复庀低车男阅堋关键词:指代消解;命名实体;基本名词短语;层叠条件随机域模型作者:谭魏璇指导教师:周国栋孔芳一
甌琣曲,命名实体与基本名词短语识别研究,瓸.,.,.:.甌琣.
猙;,—甌篊;;命名实体与基本名词短语识别研究琄
目录第一章绪论⋯⋯⋯.课题背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯研究意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯研究现状及趋势⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第二章命名实体识别研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯命名实体识别任务描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..蛄斜曜⑽⒎⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。特征模板的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..ⅰ实验结果与分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.笛橛锪稀
.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..第三章基本名词短语识别研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基本名词短语识别任务描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.基本名词短语识别的系统框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。分类器的选取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...≡⋯⋯⋯⋯⋯⋯⋯指代消解的基本概念及研究