1 / 59
文档名称:

【硕士论文】一种轻量级个性化搜索引擎的研究.pdf

格式:pdf   页数:59
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

【硕士论文】一种轻量级个性化搜索引擎的研究.pdf

上传人:phl806 2012/5/11 文件大小:0 KB

下载得到文件列表

【硕士论文】一种轻量级个性化搜索引擎的研究.pdf

文档介绍

文档介绍:哈尔滨工程大学硕士学位论文
摘要
如今网络搜索引擎成了人们获取信息的一个重要途径,人们在希望搜索
引擎能够提供全面的信息资源的同时,也对搜索引擎的服务提出了更高的要
求。如何能通过一种有效的方式获取最有用的信息是用户所需要的,也是个
性化搜索引擎必须提供的一种服务。
用户往往希望搜索引擎能够根据自己的实际情况来定制,这反应到信息
检索领域便是个性化的搜索服务。目前传统的基于服务器端的搜索引擎虽然
能够为用户解决兴趣搜索的需求,然而用户需要频繁地与行为数据库通信,
这将造成行为数据库的超负荷运行。
基于此,本文提出一种新式的搜索结构——轻量级个性化搜索引擎,以
减少服务器端开销为目的,同时能够很好的解决因客户端存储限制的缺点造
成的排序误差。这模式结合了客户端存储资源与服务器端用户兴趣库,同时
引进了客户端服务代理技术,在一定程度上减少了服务器端用户兴趣库的访
问瓶颈。另外客户端、服务器端与客户端服务代理三者的松耦合连接方式增
加了个性化搜索引擎的灵活性。本文着重研究客户端、客户端服务代理与服
务器端的通信规则,详细研究了在为用户提供高质量兴趣搜索服务的基础上
如何减少三者之间的通信流量的问题。同时给出了客户端、客户端服务代理
与服务器端用户兴趣的获取与更新算法。最后通过实验系统验证了轻量级个
性化搜索引擎的可行性并与传统的基于服务器端的个性化搜索引擎进行了性
能比对分析。实验证明轻量级个性化搜索引擎在服务器性能方面得到了一定
程度的改善。
关键词:搜索引擎;个性化;用户模型;代理
哈尔滨工程大学硕士学位论文


.
猘瓾





.


.

琣,
痩甌
. 痠.

, —
痮甀, 猚.

. ,

镃. 痠
, —.

.
,
.
: ;籾籥
哈尔滨檀笱妒节论文
第绪论
课题研究的目的和意义
如今的因特网对多数人已不再陌生,网络搜索引擎⋯成了人们获取信息的
一个重要途径,人们在希望搜索引擎能够提供全面的信息资源的同时,也对
搜索引擎的服务提出了更高的要求,这是搜索引擎设计的一种挑战,也是未
来搜索引擎的发展趋势。
纵观目前因特网上流行的搜索引擎,普遍是基于关键字的查询,用户的
每次搜索都是相互独立的,不能根据用户的兴趣给出适应用户需求的查询结
果。而如今社会分工的细化与个人兴趣的不同,决定了不同领域的用户,不
用社会群体对信息需求的不同。于是现在的搜索引擎应该能够根据用户的不
同需求来对查询结果进行排序,也就是针对不同用户的个性化定制,使搜索
结果根据用户需求收敛,使搜索引擎趋向于反映用户的偏好。
为了适应这种需求,人们提出了个性化的搜索引擎纳杓扑枷耄ü
加用户行为数据库来跟踪用户的兴趣或需求。但是,这需要在服务器端建立
庞大的用户信息库与用户行为库,用户每次访问都需要频繁地与数据库服务
器通信,在如今面向因特网的搜索来说,这种开销限制了这种方法的可行性,
此外通过用户登录搜索的方式,对于公共搜索引擎的用户来说,也不是一种
方便的信息查询方式。但是完全将用户行为存储在客户端又会因为客户端存
储有限,无法真正反映用户兴趣,造成搜索结果的片面。
基于此,本课题的研究着重于一种轻量级的个性化搜索引擎的设计思想
与实现方法。所谓轻量级是指在搜索引擎的客户端存储部分用户兴趣记录,
同时结合服务器端的用户兴趣库,客户端与服务器端按需交换信息,减轻服
务器负载,充分利用客户端的资源来实现个性化的搜索。通过客户端的存储
与服务器端的用户行为跟踪引擎的结合,本文给出了针对用户不同需求,符
合用户兴趣的个性化搜索引擎的解决方案。
国内外研究现状目前对个性化搜索的研究的技术主要是信息检索技术、推荐技术、用户聚类与用户建模技术等。.随着因特网的发展,人们在对个性化信息服务的研究过程中逐渐意识到,个性化服务的质量不仅仅取决于具体的检索技术或是推荐技术,大部分还取决于对用户兴趣记录和使用偏好的挖掘。而对这些信息的可计算描述在如今追求个性化服务的网络中显示尤为重要。近年来在个性化搜索的研究中,对用户模型的研究显得比较突出。用户建模技术已经开始从具体的个性化服务形式中脱离出来,作为个性化信息服务中的基础技术来研究。动形成一个用户模型。它用于在用户浏览时向用户建议其可能感兴趣的链接,这些链接与用户当前访问的页而内容相关。系统不要求用户进行显示的评价,主要是通过分析用户的浏览行为确定用户的兴趣爱好。提出В前镏没в行т篮退阉鱳的代理,低场是大学开发的基于中八个搜