1 / 58
文档名称:

基于相关度模型的个性化元搜索引擎设计与实现.pdf

格式:pdf   页数:58
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于相关度模型的个性化元搜索引擎设计与实现.pdf

上传人:quality 2014/3/28 文件大小:0 KB

下载得到文件列表

基于相关度模型的个性化元搜索引擎设计与实现.pdf

文档介绍

文档介绍:东北大学
硕士学位论文
基于相关度模型的个性化元搜索引擎设计与实现
姓名:于振雷
申请学位级别:硕士
专业:计算机应用技术
指导教师:常桂然
20060101
摘要基于相关度模型的个性化元搜索引擎设计与实现然后,本文介绍了这个个性化元搜索引擎的总体设计和实现细节。包括文本模型、面对着厦娴暮A啃畔ⅲ琖用户往往只对其中的很小一部分感兴趣。不同的用户,由于他们各自的需求不同,因此他们需要用不同的“角度”、不同的方式去“看待”厦娴暮A渴荩撬刈⒌哪且恍〔糠中畔⑼泻艽蟛煌T谡庵智疤下,普通的阉饕妫捎谄涫褂玫囊趁嫫拦兰际醪⒉豢悸歉鞲霾煌没У氖褂习惯和偏好,因此它们不可能满足所有人的需求。对这个问题的一种解决办法就是建立个性化的阉饕妗K降摹案鲂曰保也就是搜索引擎会根据单个用户的习惯自动调整自己的设置,以使检索结果尽量满足该用户的需求。从某种意义上说,个性化搜索引擎就好像为每一个用户单独量身定做了一个搜索引擎。本文介绍了一个个性化的元搜索引擎的设计与实现。本文中提出使用词汇之间的“相关度”来存储单个用户的个性化信息。并提出了能够在用户进行检索的过程中自动建立针对该用户的“词汇相关度”信息的算法,以及植煌睦么驶阆喙囟榷缘撞搜索引擎所返回的结果进行重新评估并进行个性化排序的算法。本文首先介绍了构建该个性化元搜索引擎所涉及到的相关技术、相关理论和假设。相关技术主要包含与元搜索引擎相关的技术和与个性化服务相关的诰蚣际酢⑽本建模技术。理论和假设主要涉及到关于语义与词汇之间的联系与区别的论述。各个算法的实现,系统地静态模型和动态模型。接着文本介绍了在该原型系统上进行的实验以及实验结果。我们得出如下结论:相关度模型是一种有效的个性化技术,它可以大大提高搜索结果的质量。最后,我们对本文的内容进行了总结,并提出了进一步的工作方向。关键词:信息检索;个性化;元搜索引擎;词汇相关度东北大学硕士学位论文..
—.,:瑄甀癢狢’’,东北大学硕士学位论文痯,..眛瓵,甌,,..畆痙,—
;—东北大学硕士学位论文籶籱.—
独创性声明学位论文作者签名:于插秀期:加汐脾琿卑学位论文版权使用授权书的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作意。本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。缱髡吆偷际ν馔辖涣鳎朐谙路角┟环裨蚴游2煌狻学位论文作者签名:导师签名:签字日期:日
第一章绪论研究背景量的不断增多,也给网络用户带来了新的问题——如何才能从这数百亿趁嬷锌信息时代,随着网络信息总量的迅速增长,网络逐渐深入到人们生活的方方面面。网络上数百亿趁嫠拇罅康闹J妒购芏嗤缬没芤妗H欢缧畔⑹速找到自己所感兴趣的内容。由于网络上的信息是非结构化的、动态的、并且又包含很多种不同的语言文字,这使得畔⒓焖髡飧鑫侍獬晌R桓鎏粽健>」芟馟://甮畉ⅲ://://.这些商业化的通用阉饕嬉丫谀持殖潭壬辖饩隽薟信息检索这个问题,然而由于没数量庞大,这种通用的搜索引擎不可能同时满足所有用户的需求。因此,没г诿对搜索引擎所返回的动辄数百万条的查询结果时,常常会感到困惑和无奈。不仅如此,阉饕娴牧硪桓鲋匾H毕菔堑ジ鏊阉饕嫠芄患焖鞯囊趁媸常有限。不仅如此,每个商业化的阉饕娑加幸惶鬃约旱乃惴ɡ唇幸趁嫠阉和对页面进行评价,甚至不同的搜索引擎,书写检索词的语法格式也不尽相同。用户不太可能了解所有搜索引擎的特性和语法格式。在用户不了解搜索引擎的使用方法的情况下,显然,信息查找必定是低效的。从用户的角度来看,“应付”太多的各不相同的搜索引擎是很麻烦的。元搜索引擎的发展,在一定程度上解决了以上的问题,但是,如何将来自不同的底层搜索引擎的查询结果组合起来、如何能够将更加“有用”的结果更“早”的显示给用户仍然值得研究。另外,由于网络页面的日点击量很大,绝大多数搜索引擎没有足够的处理能力来对趁嬉约坝没г阡纖曲页面的过程中体现出来的行为特征进行分析。因此,绝大多数搜索引擎仅仅将趁姘凑漳持炙惴ń衅拦溃缓蟀凑掌拦乐档母叩投砸面进行排序。用户在真正打开一个页面之前,不能对页面的大体内容有一个大概的了解。针对以上问题提出的在畔⒓焖髁煊蛑写嬖诘囊恍┪侍猓壳爸饕4嬖诹街解决方案。一种是构建个性化的搜索技术。这是一种可以让用户自己进行定制的搜索代理,它东北大学硕士学位论文第一章绪论.
研究意义在本文中,我们将主要讨