文档介绍:万方数据
中文叙词表本体叙词表与本体的融合木猅—!狝国盈现代图书情报技术网络信息社会对知识组织系统的需求【】编者按:数字图书馆栏目由同方知网技术有限公司协办。同方知网与电子杂志社以网络出版和知识情报服务为主要业务知识服务的《中国知识资源总库》。其中,国家重点出版项目——《中国学术文献网络出版总库》,大规模集成整合了我国学术期钲诖笱际楣萆钲【摘要】从网络信息社会对知识组织系统的需求、来自信息科学界和其他相关各界的应对发展现状等方面,详细阐述实现中文叙词表的形式化表示和网络应用的重要性和迫切性。对叙词表和本体的概念进行深入的比较研究,论证将他们合二为一的可行性。阐述直接采用而不用硎局形男鸫时肀咎的原因,并列出具体的类定义和属性定义。中文叙词表本体共建共享系统亩嘞罟δ芎腿舾稍拖低车氖现,证明这些定义的科学性、可行性和通用性。【关键词】叙词表本体知识组织系统步ü蚕鞳【分类号】【】搜索引擎的问世使自然语言成为网络信息检索的主力语言,传统的叙词表、分类法、规范档等受控语言似乎方向,依靠自主开发的全文数据库管理、知识挖掘与数字出版等先进技术。与社会各界通力合作,坚持打造可为全社会提供各种刊、博硕士学位论文、会议论文、报纸、年鉴、工具书、学术图书、专利、标准、科技成果等各类文献资源。尤其是基于《总库》的行业、专业与个性化数字图书馆,融合了各类先进的知识服务模式,为高效率创新、学习和管理决策创造了理想的信息化环境。曾新红,產琒瑆猺瓺.—.—,.收稿只期:——·本文系国家社科基金项目“基于本体和知识集成实现中文叙词表的升级、共享和动态完善”钅勘嗪牛的研究成果之一。
万方数据
总第甑期騞鸱踝匀挥镅訥劣腷呷媸芸赜镅识组织系统——以叙词表和分类法为代表的情报检索畔⒖蒲Ы图书情报界挠Χ匝芯正在被网络信息社会所抛弃。自然语言真的可以取代受控语言吗蛘咚担缧畔⑸缁嶂恍枰4笾诨标签笔者认为答案是否定的。网络信息的海量和无序已使越来越多的人在思考网络信息资源的有效组织和高效检索时,重新把目光投向了传统的知语言。网络知识组织系统,就是在这样背景下产生和发展起来的。局铝τ谔致酃δ芎褪菽P停允怪J组织系统绶掷嘞低场⑿鸫时怼⒌孛砗捅咎能够作为网络化的交互式信息服务,通过来支持多种信息资源的描述和检索。“。有两种类型:一种是来自信息科学界垂谒称的图书馆学情报学界或图书情报界拇持J蹲织系统的延伸和发展,如分类法、叙词表、主题标题表、规范档等的网络应用;另一种则是在网络环境中产生和发展起来的语义工具,如本体和语义网络鏦脖怀莆4驶闶库等。关于领域的研究现状见参考文献已作了较为全面的综述,最新动态则可参见网站⋯,本文不再赘述。在此着重介绍在框架下睦嘈停教种饕Q芯慷韵蟆!P鸫时砗捅咎逶其中的位置。笔者对参考文献—中的相关内容进行了综合、修改和补充,给出睦嘈头植既缤所示。从图锌梢钥吹剑琋蚣芟碌腒是一种广义的知识组织系统概念,包括所有的阋宓受控词表,大致可分为:从最简单的线性结构和提供多义性刂频母髦质跤锪斜恚骄哂械燃豆叵悼制和树状结构的分类法和范畴表行┖倭亢嵯蛳关关系,如俚交诠叵含纵向等级关系和横向相关关系屯唇峁沟闹J蹲橹低忱嘈汀叙词表和本体同属于这种结构最复杂、控制程度最高的类型。有理由相信:只要解决了最高端类型的知识组织系统的形式化表示和网络应用问题,其他低端恼庑┪侍庵皇撬募蚧钥捎卸狻传统的手工编制和纸本服务方式显然不能满足网络时代用户对叙词表的需求。为用户提供交互式或自动术语学支持的前提是叙词表的数字化和网络化。国际信息科学界已为此作出了巨大努力。参考文献,ü罅渴道樯芰诵鸫时怼分类法等传统知识组织系统在国际上的网络应用,展示了传统的知识组织系统在网络环境下所具有的蓬勃生命力。王军等在参考文献薪獽在网络环境下的表示和发展大致划分为三个阶段:牡缱踊籋表示的挥糜镆逋的相关技术鏧、以及钚峦瞥龅腟表示1收叨运堑谋硎鲎髁艘恍┎钩浜托薷模并结合参考文献,鹊南喙啬谌荩訩在网络环境下的表示和发展作以下综合评述。的电子化:缁⒄沟那捌诮锥是牡缱踊硖卣魇荎的描述和数据库化。用数据库存储和表示方便了对的管理和访问,也便于将他们与相应的电子资源集成在一起。例如:在英国科学文摘和工程索引数据库中分别集成了词表和词表,以方便查询词的选取、扩检和缩检等操作。世纪年代以后,我国采用计算机技术编制的许多专业性叙词表,也是和检索系统集成在一起开发的。格式是图书情报界用来对书目、分类法、主题词表、规范档等进行交换的标准格式。例如、继峁㎝姹静⒖梢栽谕喜檠!吨型法》编委会也在年轮赂軺并结合《中图法》的结构特点设计了“中国分类法数据机读格式”⒁谰荽烁袷浇⒘恕啊吨型挤ā图嘈头植纪
万方数据
布的鸫时淼腛版本¨薄5取在用或其前身等硎綤国固现代图书情报技术机读数据库”¨。可惜的是,这一版本的《中图法》未提供开放的网上查询服务