1 / 130
文档名称:

[优秀论文]基于概念图匹配的语义搜索.pdf

格式:pdf   页数:130
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

[优秀论文]基于概念图匹配的语义搜索.pdf

上传人:化工机械 2013/3/27 文件大小:0 KB

下载得到文件列表

[优秀论文]基于概念图匹配的语义搜索.pdf

文档介绍

文档介绍:上海交通大学
博士学位论文
基于概念图匹配的语义搜索
姓名:朱海平
申请学位级别:博士
专业:计算机应用技术
指导教师:俞勇
20061001
基于概念图匹配的语义搜索摘要配查询内容的搜索技术。针对本文所面向的问题域——匹配文本描述内息过载”问题又降低了它的可用性。当人们依赖于搜索引擎和信息检索技术来寻找信息的时候,却发现目前的关键词搜索方法在很多情况下并不能很好地满足他们的信息需求。究其原因是因为仅仅使用关键词并没有明确地表达出用户查询的语义,即便是使用查询扩展和词义消歧的技术也不能完全解决这个问题。于是,对“语义搜索”的要求便应运而生。由于其跨领域的特性,语义搜索至今还没有一个公认的定义。不过,自然语言处理、文本挖掘、知识表示及推理等方面工作的大幅进展,以及语义网的兴起,已经大大推动了“语义搜索”的相关研究。本文所要容的资源搜索,并且在比较了各种语义搜索常用的知识表示语言的特点之后,我们最终选取了概念图来作为我们方法中的语义表示。它是一种具有一阶谓词逻辑的完整表达能力的图形化表示,因而可以把语义匹配本文的主要工作和贡献葱碌可以概括为以下几个方面:岢隽艘恢窒拗频礁拍钔嫉囊桓鲎蛹系闹J侗硎荆源锏娇梢在语义匹配时把概念图展开成树的形式的目的,但同时又保留了相对本文的问题域而言是足够的表达能力。我们根据资源搜索的领域特征,为每张概念图指定一个入口概念,并且对互指链接、支配概念等方面都做了严谨的约束。该设计的结果是在概念图中保留了对否定描述的表达能力,故而基本可以满足所有与资源搜索相关的概念图表示;同时又为之后降低图匹配的计算复杂度打下了基础。姆伤俜⒄挂丫顾晌J澜缟献畲蟮囊桓鲂畔⒖猓恰靶解决的语义搜索是一种基于明确的、形式化定义的语义信息而进行的匹归约到图匹配,而又不失逻辑的严密性。
酶拍詈凸叵档睦嘈筒愦危ㄒ辶艘恢中碌母拍钕嗨贫群凸叵途经最近公共父类的语义距离来导出相似度的定义。但同时,我们又在其中引入了本体不同部分有不同“密度”的思想,为本体的不同层次之间定义了不均匀的跨度。随后,我们又根据资源查询的特点,讨论了概法来表示颜色描述的语义,并为之关联一组相应的相似性量度。该项工作展示了在数值空间发掘概念的“更深层次”语义的意义。有研究表明,某些概念仅仅利用概念层次来决定语义相似度是不够的,颜色概念就是一个典型的例子。我们从颜色空间模型上发掘颜色描述的“更深层次”的语义,利用丈ǹ占淙龇至可系牧ナ艉暮铣衫炊ㄒ迦我庖个非彩色颜色或彩色颜色的模糊语义,并且采用模糊概念图的逻辑形式来表示这类语义信息。之后,我们又依据上述定义的隶属函数,针对查询色和资源色的不同组合设计了一组相应的相似度评判函数。实验证明该方法有助于减小相似度评判与人类感知之间的语义鸿沟。语义匹配结果。设计这样一个过程的目标是要尽量消除同义异构现象给匹配带来的负面影响,并且借助世界知识在已有的概念图中加入推理出来的被隐含的信息。为此,我们定义了图规则幢尘爸J的表示形式,并从概念图的一阶推理法则中导出了一条经过简化的、适用于我们知识表示ū硎咀试春捅硎竟嬖虻母拍钔的推理法则。该法则确保了推理过程的可靠性,但在某些情况下可能会牺牲完备性。不过,基于问题域的特性,我们认为后者是可以接受的:我们并不是要得到所有为真的知识。最后,我们还对知识增益过程的触发以及终止条件做了规相似度,在本体各部分有不同“密度”以及相似度的非对称性等方面做了细化。从经典的概念图理论出发,我们通过概念和关系在类型层次上念相似度和关系相似度的几个非对称定义的变种,这为最后定义概念图之间相似度的工作做好了铺垫。谄琅懈拍钕嗨贫确矫妫徊教岢隽艘恢只谀:呒男路肓艘桓龌谘菀锿评淼闹J对鲆婀蹋窗镏竦酶既返
ü杂没阉餍形5慕#8拍钔忌杓屏艘桓龊枪撕团分别规定了在过滤条件和排序条件下,子树匹配相似度的不同定义方法,相似度定义还兼容了对否定条件的处理,并且利用两类调谐因子来增加匹配过程的灵活性。通过对匹配算法主体的时间复杂度分析,证明为多项式时间的算法,因而可以保证其在实际应用中的有效性。在实际中,我们实现了一个名为脑拖低常⒀∮梅领域来验证我们的方法。从实验结果来看,本文所提出的语义搜索方法,步骤而基本可比于后者。因为并未针对所选的应用领域做特别的限制或优化,所以我们相信该方法具有普适性,也可以部署到其他领域的资源次”的语义表示和匹配,以及融合了过滤和排序痪条件的混合匹配模型,对于在精确的语义搜索模型中引入模糊的、不精确关键词:语义搜索,信息检索,概念图,语义相似度,模糊/不精确语义,混合匹配模型范,以保证该过程的有效性。序两类操作的混合匹配模型。该模型在概念图转换成树结构的基础上,以及最后如何合成为查询图和资源图之间的匹配量度。整个相似度的计算过程是递归定义的,并且概念相似度与关系相似度是紧密耦合

最近更新