文档介绍:中文摘要
本文面向中文信息处理的实际需要,以现代汉语框架语义知识库
,简写作为处理对象,研究如何对这部词典进行有效的信息组织,
使之成为一部计算机可读、可理解的语义词典,为新一代万维网——语义械
语义知识共享以及智能化、个性化的裉峁┗∽试础
现代汉语框架语义知识库是一个以的框架语义学为理论基础、以真实
语料为依据编纂的汉语计算机语义词典,它包括框架库、词汇库及例句库三个子库。
如何有效地对母髦肿试唇兄J侗硎荆亲畲笙薅鹊厥迪制溆τ眉壑档墓丶
问题。
知识本体是一种新的基于男畔⒆橹椒ǎ芄挥行У亩砸
特网上的海量信息进行组织、管理和维护。从知识共享角度看,本体可以看作是一
种概念化的显示说明,是对客观存在的概念和关系的描述,它将隐性的概念模型表
达出来,大大减小了机器理解问题域中的概念和逻辑关系时可能造成的误解。
本文即以本体为描述工具,提出了一种专门针对词汇语义知识库的信息组织表
示方法,即利用知识本体的组织方法将语义词典的信息组织起来,将概念按不同抽
象度来划分层次,构造面向特定领域的框架语义知识集,收集所有与该领域有关的
词汇跤,通过节点的方法一一对应的放入项层概念蚣内,来构建专门针对
的本体模型。
我们通过已经对几个构建好的框架进行描述,成功的使用了昙怯镅远云
结构进行描述,使得中文框架网络在结构标记上有了一个成功的样例。之后用
Ⅺ钥蚣艿哪诓啃畔⒔凶试疵枋觯浞盅凹笆导俗试疵枋隽O荡驶
的重要性,在对一个资源描述前必须先定义一系列文档内需要用到得词汇,这样在
文档中应用这些定义过的词汇和属性,便于计算机在读取文档的时候能够快速准确
的得到必要的信息,但是仅仅用对框架进行描述,除了其自身没有推理
机制外,它在书写上面也有些繁琐。因此,我们最后选择了运用钥蚣芙忻
述,因为其自身带有的判定推理系统,再加上框架网络对词汇准确定义的优势。
文章主要分为两个部分,第一部分包括第二章和第三章,主要阐述现代汉语框
架语义知识库的理论基础和构建方法,同时与知识本体理论相结合,以语义知识库
中的词元为目标词,加入语义信息,以“域”为单位将词元以相同特征聚合在一起,
百度排名/ 童装批发网/
对现代汉语词语进行组织;第二部分包括第四章和第五章,主要是针对前两章提出
的词典信息组织方法进行应用探索,尝试以形式化的方式对现代汉语框架语义知识
库的组合规则进行全面的描写,详细阐述语义畔⒈昙怯镅訶、
的发展历程、特征及文档结构,研究一种基于镅缘闹J侗硎痉椒ǎ⒄攵訡
中三个子库的实例,分别给出具体的硎狙荆灾っ髡庵直硎痉椒ǖ目尚行
和有效性。
就研究意义来说,本文用语义昙怯镅远怨菇ㄏ执河锟蚣苡镆逯J犊獾
形式化知识表示做了探索性研究,并得出了具体成果,直接意义在于为中文信息处
理的语义分析提供语义知识本体组织方法及其具体描述成果;同时,推动了新一代
万维网信息检索技术的发展,使之不再拘泥于关键词检索,而是加入自然语言语义
信息,从而提高畔⒓焖鞯牟槿屎筒樽悸省
关键词:知识表示:现代汉语框架语义知识库;框架语义学;知识本体;语义
Ⅺ也:;僳
中图分类号:
.
!猄
.
畊騛
甌
,
甇勰
甀
百度排名/ 童装批发网/
甌
船
瑃
嗽瓸
瓼
ⅱ鬷Ⅱ
.
瓼
琲
琣.
⒗騮
瑆
,
. 琲
琣
. ,
琑甋阦
, , ,
’甇琲
琾
甌
删. ,
—
.
篊; 籓籗
; 籛
;
百度排名/ 童装批发网/
第一章引言
第一章引言
研究背景
上世纪年代以来,自然语言语义处理从句法学方面转移到语义学和语用学方
面,而语义学是重点,词一级语言单位的语义研究又是重中之重。实践证明,只进
行句法规则的描述是不够的,语言描写要落实到词这一级语言单位上来【¨。因此,词
汇语义学的研究成了当前世界语言学发展新潮流中的迫切需要,词汇语义学又是其
重点突破口。无论做机器翻译、信息提取,还是词汇语义排歧,语义知识库是所有
这些应用的不可或缺的一项基础性资源。。
目前语义分析方法基本可以概括为两种:一种是在句法关系链上添加相应的语
义关系标签,例如磌【渴窃赑浞ǚ治龅幕∩希杂攵视泄
的语义角色进行标注,包含多个语义角色类型;汉语方面,如李涓子等的依存语
义分析【俊⑻ㄍ逯醒性闹形木浣峁故髯柿峡【浚
几十个语义角色,在句法关系链上添加语义标签。