文档介绍:..—:篐::..
日卜怵训小学位论文作者签名:珈惭学位论文作者签名:露矽饼畗日期:砂。西华大学学位论文独创性声明西华大学学位论文版权作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,’、使用学位论文的规定,在校攻读学位期间论文工作的知识产权属于西华大学,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,西华大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。C艿穆畚脑诮密后遵守此规定指导教师签名:’.
要摘本文将搜索引擎与本体技术相结合,提出主题爬行虫入口一初始选择方法,并从理近年来,随着本体技术的迅速发展,因具有良好的概念层次结构和对逻辑推理的支持,本体在面向知识表达和信息检索方面得到了广泛的应用,并且成为人工智能、语义挖掘等领域的研究热点。由于际醯目焖俜⒄梗浜A渴莸母丛有浴⒍态性和用户主题的普遍性等特点给现有的搜索引擎发展带来了极大的挑战。怎样在中及时地、有效地、精确地定位用户主题资源是提高搜索引擎的检索效率的研究重点。论和实验角度说明初始对于主题搜索引擎的重要性。首先,通过形式概念分析理论,提出用户兴趣本体的构建方法。具体方法:自下向上合并分类概念格和文档概念格,形成能够表达用户兴趣的优化概念格,通过概念格一本体转化的规则,最终形成用户兴趣本体。该本体构建的目的是通过描述概念及其间的关系来指导主题爬行虫的行为,选择与主题相关的网页,满足用户的个性化需求。其次,本文在利用唇咏峁沟耐保岷嫌没巳け咎澹岢隽嘶谟没巳本体的初始选择方法。该方法的特点是①将用户兴趣本体与算法相结合,一是利用本体信息对算法获取基础集进行修剪,提高算法主题识别能力;二是利用算法得到的权威网页和中心网页描述主题区域,并对用户兴趣本体进行更新,通过用户兴趣本体加权扩展用户的兴趣主题,使之能准确表达用户兴趣需求;②该方法将网页内容和链接分析同时考虑来发现兴趣主题,通过利用图论相关知识,把寻找“核心主题区域’’的问题转化为“在完全有向图查找完全二分有向图”的问题,从而降低了算法实现的难度;③利用用户兴趣本体扩展兴趣主题特征向量,并与权威页面集进行相似度计算,重新过滤搜索结果得到最终的初始。最后,利用甇开发应用程序进行验证。实验橛没Р檠始峤桓苑祷氐慕峁写恚菇ǜ拍罡瘢⒐菇ㄓ没巳け咎濉J笛实现基于该本体的初始选择方法,目的是通过此爬行虫入口,返回更对与用户相关的信息。实验表明,通过本文本体构建方法,用户兴趣本体能比较好的表达用户兴趣和知识背景,并消除其语义模糊性。因此,用户兴趣本体为实现个性化主题搜索奠定了基础。另外,通过实验评价了本文提出的初始选择方法。使用本文方法选择初始与任意指定初始提交给普通爬行虫,比较爬行虫在下载相同网页的数量中相关网页数量。另外,通过获取的三种方法进行实验对比,证明了本文提出的基于用户兴趣本体初始选择是有效的。关键词:初始,用户兴趣本体,概念格合并,完全二分有向图,主题区域西华大学硕士学位论文
,:①,②,.篢瓻:基于用户兴趣本体的初始选择方法的研究甀挝鱨鷏,琣瓻琣琲瓵疭疭瑚∞’.,甤’。””,.琣螴,疭痶.,Ⅱ
.篠西华大学硕士学位论文;甌,琧瓵;;;穑甧/
目录摘⋯⋯...⋯⋯.⋯⋯⋯⋯⋯⋯.⋯⋯.⋯⋯⋯⋯⋯⋯⋯.⋯⋯.⋯.....⋯.⋯⋯...⋯.⋯...⋯⋯⋯⋯..⋯⋯...绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一研究动态⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯基于谋咎搴喜⒐⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。主题区域提取技术研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一研究目的与意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯论文结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一诟拍罡窈喜⒌挠没巳け咎骞菇ǚ椒ā形式概念分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一本体相关知识⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本体的定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.拍钛≡ⅰ嬖颉璴用户兴趣本体构建实验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.实验