1 / 88
文档名称:

现代汉语动宾搭配多角度考察及其自动识别.pdf

格式:pdf   页数:88
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

现代汉语动宾搭配多角度考察及其自动识别.pdf

上传人:Horange 2014/6/24 文件大小:0 KB

下载得到文件列表

现代汉语动宾搭配多角度考察及其自动识别.pdf

文档介绍

文档介绍:南京师范大学
硕士学位论文
现代汉语动宾搭配多角度考察及其自动识别
姓名:程月
申请学位级别:硕士
专业:语言学及应用语言学
指导教师:陈小荷
20080427
中文摘要词语搭配是一种具有一定语法结构关系的、哥重复出现的词语的组合。~般指其体词语之间的组合关系,在自动句法分析、机器翻译等领域,能发挥不可替代的作用。而动宾搭配更以其使用的高频性、复杂性、灵活性受到学者的广泛关注,其也更是构建词语搭配库豹核心闷题之一。单纯依靠人工筛选建席是不可取的,自然语畜处理就是要对词语搭配进行深入在广义搭配观下,基于精确标注的清华汉诱树瘁语料,针对动宾搭配主要微了两部分工撵,其一,对动宾搭配的多角度考察;其二,对动宾搭配的自动获取与识别。第一部分从定性和定量相结合的角度考察了树库中抽取到的龃配实例。定性考察主要在搭配的词序、词性、动词的语法属性、搭配中的词汇语义作用等方面,弱绕词语搭配所涉及到的语法、词汇、语义吕砺呒等层面,作出相关分析,为后续识别阶段提供理论参考;定量考察主要分绍了搭配自动获取与识别的常用缆诗量,著对树库中的动宾搭配在搭配频次、互信怠、距离的平均值与方著等方面作了统计与分析,甄别哪第二部分分别基于传统统计方法和统计机器自动学习方法对动宾搭配进行了自动获取与识别。传统的统计方法,处理模型眈较简单,多麓单一的统计量,如共现频率、互信息等,识别结果翟プ笥遥Ч簧趵硐搿S谑牵O蚧诨髯远暗母丛油臣颇P条件随机场进行动宾搭配的鸯动识别。详细实验了分词与词性标记集不同对实验结果薛影晌,词性组合序鳓类型的限定不同对实验结果的影响,不问来源语料及规模对实验结果的影响。在特征设置阶段,实验了音节特征、动词次范畴特征、上下文特征以及它嬲之间的缝合特征,给实验结果带来的变化。综合实验结果,基于树库分词和词性标记的最好结果是ィ诒贝蟊曜嫉姆执屎痛市员昙堑淖詈媒峁荈值.%。动宾搭配自动识别的结果显示出在序列化标洼方面确实有效可行,后续识别工作仍有提高空闻。关键词:动宾搭配:自动识剐;句法分析;条件随机场;特征模板:地研究,找到适合计算机大规模处理的方法。部分统计数据后续识别阶段较为有用。
烈篤狾—瓵.%,.%,,琧琣甊甌.:;,.琣—,,,.琣..琣瓻—,琣,,瓹—.籄;籆籉
学位论文独创性声明学位论文使用授权声明本人郑重声明:⒓岢忠浴扒笫怠⒋葱隆钡目蒲Ь翊邮卵芯抗ぷ鳌⒈韭畚氖俏腋鋈嗽诘际χ傅枷陆械难芯抗ぷ骱腿〉玫难芯⒈韭畚闹谐耐猓惺笛椤⑹莺陀泄夭牧暇钦媸档摹⒈韭畚闹谐暮椭滦坏哪谌萃猓话渌嘶蚱渌已经发表或撰写过的研究成果。⑵渌径员狙芯克龅墓毕拙言诼畚闹凶髁松鞑⒈硎本人完全了解南京师范大学有关保留、使用学位论文的规定,学校有权保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版;有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅;有权将学位论文的内容编入有关数据库进行检索;有权将学位论文的标题和摘要汇编出版。保密的学位论文在解密后适用本规定。成果。了谢意。作者签名:日期:
§动宾搭配的研究目的及意义丹吾现代汉语中词语搭配是十分重要的语言知识。词语搭配规律往往表现在表示具体意义的词语上,在使用上习惯性很强,规律性相对较弱,用规律难以概括。倘若在大规模的语料库供重要的知识来源。这种收录单纯依靠人工的筛选是不可取的,计算语言学领域向来注重面向机器的人规模的文本处理,因此,有必要对词语搭配进行深入地研究,找到适合计算机大规模处理的方法。动宾搭配是构建词语搭配库的核心问题之一,动词与其他词类相比,在语法和语义使用语为谓语的句子出现的频率最高。正是因为动宾搭配的重要性、高频性、复杂性以及灵活性,对于自动句法分析而言,必动宾搭配研究属于词语搭配研究的一个重要分支,概括地说,词语搭配研究的意义主要不管是在英语还是在汉语中,词语搭配都聚焦了不少学者研究的目光。特别是汉语中词的结果异常丰富。正因如此,语言学家从各个角度对词语搭配进行研究,包括语法、语义、词汇、篇章、修辞等各个角度,透过词语搭配的现象深入挖掘相关的语言学规律。特别是动组合关系上进行互动研究,这一研究将关系到整个语法体系的构建。过程中,需要激发人内在的语言知识,包括词法知识、句法知识、语义知识和语用知识等等。形式化表示。目前可形式化提供给计算机的有语法规则或者语义规则等,它们在某种程度上反映的均是类别之间的关系,而涉及到具体词之间关系的词语搭配知识,将能与之优势互补。如果有大规模的词语搭配资源,就可以利用词语间搭配关系确定语块,进而在高层次上实现句法分析。在自动句法分析中,歧义结构火量存在,借助词语搭配知识能够辅助处理一些歧义消解的工作,例如,在语法功能匹配的句法分析中≈,借助词语搭配知识在机器翻泽阶段生搬便套,将使得译文极不“地道”。所以有学者提出“