文档介绍:《现代图书情报技术》版权所有,欢迎下载引用!
请注明引用地址:基于本体的语义相似度计算方法研究综述[J,现代图书情报技术,20109(1):51-56.
总第 188期 2010年第 1期
基于本体的语义相似度计算方法研究综述
孙海霞1 钱庆1 成颖2
1
2
【摘要】在对基于本体的词语语义相似度进行界定的基础上,对基于本体的语义相似度研究进行综述,分别阐述
基于距离的语义相似度计算、基于内容的语义相似度计算、基于属性的语义相似度计算和混合式语义相似度计算
等算法模型,最后从宏观层面指出今后本领域的研究方向。
【关键词】语义相似度语义相似度计算本体概念匹配
【分类号】TP391
ReviwofOntlgy-basdSemantcSiiariyMeasrig
SunHaii1 QinQig ChengYig
1
2
【Absract Basdontegenerldefniinanddisratonfrsmantcsmiart measrngofOntlgy ti paper
makesarviwofrsarhonteOntlgy-basdsmantcsmiartmeasrsitoducesedgecountngmeasrs i
fratoncontntmeasrs fatr-,ipoitouttediecton
offtr wor fommacrsopiperpectve.
【Keywords Semantcsmiart Semantcsmiartmeasrng Ontlgy Concept-basdmathig
1 引言
与前些年的信息资源匮乏相比,现在信息用户更加关注的是如何从海量的信息资源中发掘其所需要的信息。
信息资源异构性的存在,尤其是语义异构性的存在,使得采用传统以字符串匹配为基础的信息检索系统难以满足
用户对信息和知识的深层次需求,因此,加强基于概念匹配的信息检索系统的研究就显得尤为重要。简而言之,
概念匹配就是计算词语之间的语义相似度[1]。与传统的以词形为切入点、建立在词语字面匹配基础上的检索算
法相比,语义相似度计算是对源和目标词语间在概念层面上相似程度的度量,需要考虑词语所在的语境和语义等
信息。本体[2]因其能够准确描述概念含义和概念之间的内在关联,已成为词语语义相似度研究的基础。
目前,基于本体的语义相似度计算方法研究已经形成了丰富的研究成果,如表 1所示,因此,对其进行系统的
梳理显得十分必要。
收稿日期:2009-11-04
收修改稿日期:2010-01-15
本文系中国医学科学院医学信息研究所基本科研业务专项“基于 MeSH的语义相似度算法研究”(项目编号:09R0107)的研究成果之一。
XINDAITUSHUQIGBAOJSHU 1
(中国医学科学院医学信息研究所北京 100020)
(南京大学信息管理系南京 210093)
(IsiutofMedialIfraton,Chies AcademyofMedialScinces,Beiig100020,Chia)
ntte
c nom i
n e
c
e
jn
n
(DeparmentofIfratonManagement NanjngUnieriy,Nanjng210093,Chia)
t
nom i
,
i
v st
i
n
]
o e i ml t u n
xa 1 2a
t ,】 e h a ito seti e i i liy ui o hs
e , ,ee c oo e e i i liy ue nr i ue n
om i ,e ue e ue e ue i ue ep i y at t ns h r i
uue k r oc c s i
】 i i liy i i liy ui oo c n
5A N I
知识组织与知识管理
表 1 三个数据库的检索结果
Si(w,w)和 Di(w,w)可分别表示为 Si(c,c)
检索策略
主题=(Ontlgy) AND 主题=
(SemantcSiiart)
主题=(Ontlgy) AND 主题=
(Siiart)
关键词:相似度 AND关键词:本体
关键词:语义相似 AND关键词:本体
关键词:相似度 AND关键词:本体
关键词:语义相似 AND关键词:本体
数据库
IIWebof
Scince
CNKI
万方
结果(篇数)
210
546
73
56
125
59
和 Di(c,c),其中 Si(c,c)∈[0,],Di