文档介绍:大连理工大学
硕士学位论文
基于个性化元搜索引擎结果优化设计
姓名:孔芳芳
申请学位级别:硕士
专业:软件工程
指导教师:唐达
20060617
要摘随着社会的不断发展,的不断成长,信息越来越成为经济、科技等各个领域赖以发展的重要资源。再加上网络住处的爆炸性增长,人们在网上要想找到自己所需要的信息的难度越来越大。年前后,却笈阉饕嫦嗉逃现,发展到现在,搜索引擎已成为上网用户最经常使用的网络服务之一。如果想得到全面、准确的搜索结果,必须同时使用多个搜索引擎,在这样的背景下产生了元搜索引擎。元搜索引擎的出现,在一定程度上解决了这些问题。如何使元搜索引擎更加个性化是将来元搜索引擎的发展方向之一,目前的元搜索引擎中在这方面的工作做的很少。我们认为如何智能地选择成员搜索引擎和如何对返回结果进行去重排序是使元搜索引擎系统更加个性化的关键技术。在如何选择元搜索引擎的成员搜索引擎的问题上,我们对比了现有的成员搜索引擎的选择方法,由于目前这种方法使用的用户反馈过程不严格,很可能导致对于有用成员搜索引擎的错误判断,因此,需要对其进行改进,本文改进并提出了一种基于用户反馈的多元索引自动优化选择成员搜索引擎的调度算法。在对不同搜索引擎返回结果的排序上,采用了一种基于概率的排序方法。这种排序方法在综合考虑各成员搜索引擎相关度时,需要解决相关度的规范化和均衡化问题。另外各个成员搜索引擎的比率值相加这一点又综合考虑了各个搜索引擎所起的作用,实现了相关度的均衡化,从而客观地反映了文件的真实相关度,是一种较好的排序方法。由于不同用户的文化教育和知识背景不同,因而对同一事物有不同方面的要求,所以本系统用户建立个人兴趣模型,通过了解用户兴趣之所在,并以此为依据对元搜索引擎的检索结果进行过滤、合成和排序,经过优化处理后的检索结果必然能够更好地满足人们的需求。本文通过建立用户兴趣模型,使用兴趣生成算法、兴趣更新算法、搜索结果过滤算法,以及如何利用兴趣模型对元搜索引擎的检索结果迸行优化处理。最后,结合实际情况设计实现了一个实验系统,并给出了实验系统统一的检索界面及搜索结果页面效果图,通过对实验结果的分析,进一步强调了研究元搜索引擎系统的意义。关键词:搜索引擎;元搜索引擎;个性化;兴趣模型大连理工大学专业学位硕士学位论文
—.贼恤甒’琣基于K阉饕娼峁呕杓琩瓾瑃猧,.—,.甋%,甀,猻,...,,痶..:;;篿.’
独创性说明作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。
寝墅磁墨是竺辍辉戮氯大连理工大学学位论文版权使用授权书本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。作者签名:导师签名:大连理工大学专业学位硕十学位论文
髀课题研究的背景点、十几亿个网页的巨大分布式信息空间,而且这数字仍以每四个月一第六个月翻一具——智能元搜索引擎出现了随着约跋喙丶际醯姆⒄购统墒欤嗣且丫肓诵畔⒘考ù蠓岣坏氖代。自从的诞生以来,它已经发展成为拥有约上亿用户和几千万个站番的速度迅猛增长。据鸭暌岳吹腤内容就达到四十亿个页面,容量达到。由统计,从年到年,上的主机数量从两千万增长到一亿四千万。作为一个信息平台在人们的生活和工作中发挥越来越重要的作用,人们越来越多地通过袢⌒畔ⅰH欢信息极大丰富的同时,用户也面临着信息过载和资源迷向的问题】。上的信息过于庞杂,而且具有不稳定和变动侠的特点,没有也不可能有一个权威机构能对这些信息进行全面的整理和归类,因此,往往用户面对五花八门、扑面而来的各种信息显得无所适从,不知道如何去获取自己需要的内容。如何在浩瀚如海的信息空间里,快速查找并获取所需的信息已成为信息时代最根本的问题之一。因为网络搜索引擎在网络信息资源检索中起到重要的作用,它可以帮助用户从数以亿计的网络信息库中找到自己所需要的信息。搜索引擎是系囊恢衷谙叻方式且恢钟糜诎镏没Р檠缧畔⒌募焖鞴ぞ摺K砸欢ǖ牟呗栽诨チM兴集、发现信息,对信息进行理解、提取、组织和处理,然后为用户提供检索服务,从而起到了信息导航的目的。然而,任何一个搜索引擎都不可能ジ哺峭闲畔⒆试矗词挂恍┲放频搜索引擎的信息覆盖率也很少有超过%:同时,不同搜索引擎的检索结果的重复率仅仅在%左