文档介绍:第卷第期计算机技术与发展. .
.
年月
信息抽取中领域本体建模方法研究
易利涛,周肆清,丁长松
.中南大学信息科学与工程学院,湖南长沙;
.吉首大学数学与计算机科学学院,湖南吉首
摘要:近几年来,本体作为一种知识重用、知识共享和建模的重要工具,尤其是领域本体,在信息抽取系统中扮演着越来
越重要的角色。但是,目前领域本体的创建还缺乏系统的、工程化的方法。首先介绍了本体的概念及本体的建模准则,然
后分析了现有的几种常见的本体建模方法,并通过对比分析各种方法的优缺点,再结合信息抽取的原理以及软件工程的
思想,提出了一种新的领域本体的建模方法。该方法具有很强的逻辑性和可操作性,可被一些领域本体在建立时采用。
关键词:信息抽取;本体;领域本体;建模准则;建模方法
中图分类号: 文献标识码: 文章编号:—
—,—,—
.,,。;
.,,,
:, ,,,
.
. . —
。
.
.
:;; ;;
引言领域本体的构建尚缺乏系统的、针对所有领域的、工程
近十几年来,本体被广泛地应用于计化的方法。
算机科学的诸多领域,如知识工程、数字图书馆、信息文中旨在通过研究和分析已有的领域本体的各种
系统以及软件复用等,今已成为普遍研究的一个热点。构建方法以及其存在的问题,探索一种信息抽取系统
随着对本体的理论和应用的深人研究,取得了丰富的中新的领域本体建模方法。
研究成果,本体理论与技术也日趋成熟。基于领域本
体的信息抽取系统能够提供给用户特定的感兴趣的信领域本体与信息抽取
息,并可以通过领域本体为信息源提供必要的语义标. 本体与领域本体
注信息,从而使系统对领域内的概念以及概念之间的本体的概念源于哲学。在计算机科学
联系能够有统一的认识,进一步提高系统的查准率和中,本体是共享概念模型的明确的形式化规范说明。
召回率,最终为用户提供更有价值的信息。可见,领域这一概念具体包含以下四层含义:
本体在信息抽取系统中起着十分重要的作用。但目前概念模型。概念模型不依
赖于具体的环境计算机系统,它是纯粹反映信息需
收稿日期:——;修回期:——
求的概念结构。
基金项目:湖南省科技厅软件学课题
作者简介:易利涛一,男,硕士研究生,研究方向为信息检索、明确。概念和概念的约束都有明确
数据库应用技术等;周肆清,副教授,硕士生导师,研究方向为计算的、无歧义的定义。
机应用、数据库应用技术。形式化。通过对本体的形式化,使得
· · 计算机技术与发展第卷
本体可以被计算机识别处理。应用需求的本体建模方法,其中比较知名的有
共享。本体所包含和体现的领域知识法、骨架法、法、法、
可以被共同认可,本体所反映的相关领域内概念集可法、法及七步法等。
以被公认。.. 法
本体所强调的是特定领域中有着公认语义本质的美国公司,.
概念和概念之间的关联,同时借助概念和概念之间的的法是开发出来用于描述和获取企业本体
关联来实现语义的表达。的。是
领域本体是专业性的本体,它开发的一系歹面向功能建模的集成定义”项目。
专门用于描述特定学科领域的知识。领域本体定义了方法提供了一种在理论上和实践上均有充分根
有关该领域内