文档介绍:导师签名:恐尹一学位论文版权使用授权书独创性声明学位论文作者:蘧卑学位论文作者签名:馥单一谢,年匆月莎日珈年本人提交的学位论文是在导师指导下进行的研究工作及取得的研究成果。论文中引用他人已经发表或出版过的研究成果,文中已加了特别标注。对本研究及学位论文撰写曾做出贡献的老师、朋友、同仁在文中作了明确说明并表示衷心感谢。签字日期:本学位论文作者完全了解西南大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权西南大学研究生院可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ椋韭畚模嚎诓槐C埽口保密期限至年月止珈耗月日
~,。■
乞:研究目标与内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究的技术路线⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第鹿丶植檠讨械挠镆逦侍狻文档语义的获取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ⅰ.到诘愕娜乃饕用户查询语义的获取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..第伦酆嫌镆宓墓丶植檠惴ā算法的核心思想⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..算法的具体实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯★.Ⅱ,,.瘛.●■
一本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第率笛榻峁敕治觥实验设计的依据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第伦芙嵊胝雇本文总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯进一步的研究工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..攻读学位期间所发表的学术论文⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.,芷,·
关键词:概念相似度关键字查询最小最低公共祖先语义相关实体子树集近年来莶檠囊桓鲅芯咳鹊恪NA私饩鯴关键字查询中语义信息丢失导致查询结果质量不高的问题,本文提出了一种综合文档语义与用户查询语义的丶帜J轿薰查询方法,通过增加查询结果的语义相关性,提高查询的准确率。论文的主要研究工作如下:治隽薠文档树的结构和对应的模式信息,对文档中各节点间存在的隐含关系进行挖掘,将文档中的节点划分为实体、属性和值节点。基于节点的划分,使用表达文档基本语义的实体子树存储牡到诘慵湟挠镆逍畔ⅲ竦貌檠牡档挠镆逍畔ⅰ娣读擞没У墓丶植檠泶锸剑圆檠丶纸蟹治觯魅妨瞬檠丶窒嗷ゼ隐含的语义信息;针对用户不同的查询期望,把查询关键字归为预测关键字和结果关键字两类,预测关键字主要用于查询,结果关键字主要用于返回查询结果。岢隽艘恢指慕幕赪计算概念间相似度的算法,算法主要考虑了关键字查询过程中概念间的非对称性。并且结合相似度计算方法对两类查询关键字进行扩展查询,实现丶值哪J轿薰夭檠诨袢∥牡涤镆搴陀没Р檠镆宓幕∩希圆檠祷亟峁辛搜芯浚岢隽艘种新的返回结果集——语义相关实体子树集。对现有最小最低公共祖先算法进行改进,实现了语义相关实体子树集的求解算法。ü笛槎员龋っ髁吮疚奶岢龅淖酆衔牡涤胗没в镆宓墓丶帜J轿薰胤椒ㄏ啾扔传统的关键字查询算法,能够更准确的捕获用户查询意图,同时查询的有效性和效率等方面都能取得满意的结果。丑
●
总:::·痺甀.,痥;,琾甀,,琧瓵、’,、
竹篊两南人学硕十学伊论文;.;籗一
信息发布、信息集成、内容管理等领域。伴随着牡凳康募本缭黾樱嚼丛蕉嗟难芯人员开始关注如何高效地对牡到屑焖鳌目前,牡导焖鞣椒ㄖ饕7治A嚼啵峁够檠凸丶植檠绞剑饬嚼喾椒ǘ各自存在着一些问题:峁够檠捌淅┱狗绞对于莸募焖鳎撤绞绞褂肵结构化的查询语言进行。莸牟檠言有很多种,蚗遣檠镅缘拇怼主要用于莸闹苡危是的基础。语言于年掠蒞组织公布,它由衍生而来,吸收了蚗中的路径表示语法,同时融入了泄丶窒盗凶泳涞乃枷搿的查