1 / 55
文档名称:

毕业设计论文-基于LUCENE的群体个性化搜索引擎研究.pdf

格式:pdf   页数:55页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

毕业设计论文-基于LUCENE的群体个性化搜索引擎研究.pdf

上传人:钻石文档库 2013/9/9 文件大小:0 KB

下载得到文件列表

毕业设计论文-基于LUCENE的群体个性化搜索引擎研究.pdf

文档介绍

文档介绍:武汉理工大学
硕士学位论文
基于LUCENE的群体个性化搜索引擎研究
姓名:文义
申请学位级别:硕士
专业:计算机应用技术
指导教师:刘东飞
20100501
摘要是一个高度开放、异构和分布式的信息空间,海量的信息杂乱地散布在全球各个站点上,而且每天都以极快的速度更新。随着互联网技术的发展和网络应用的日益广泛,丫晌A巳嗣腔袢⌒畔⒆试春徒行畔⒔涣的一个重要途径。伴随着互联网的发展,畔⒁踩找嬖龀ぃ绾未雍A康互联网资料中找到自己需要的信息,成为了阻碍互联网发展的一大难题。虽然传统搜索引擎的出现极大地提高了网络信息的检索速度,在一定程度上解决了这个问题,但还是无法满足人们对信息服务日益增长的个性化需求。同时,在这个讲究个性和以人为本的时代,个性化和人性化的搜索引擎也成为了时代的需要,使得个性化搜索引擎成为了当前一个重要的研究课题。本文针对传统搜索引擎在用户个性化需求方面存在的不足,提出了一种全新的个性化理念,即群体个性化搜索。利用个性化信息采集系统收集和提取用户的个性化信息,通过扩展用户需求和优化搜索过程和结果,为用户提供个性化和人性化的信息搜索服务。本文所做的主要工作如下:⑹紫燃蛞=樯芰薒飧鲋髁魉阉饕嬗τ霉ぞ叩难芯亢陀τ茫后对当前主流个性化搜索引擎的相关原理及应用作了理论性介绍,重点对个性化信息的采集和更新进行了分析,为下一步的研究改进打下基础。⒄攵愿鲂曰阉饕娲嬖诘牟蛔愫臀侍猓岢隽艘恢秩碌母鲂曰索引擎思想即群体个性化搜索技术。通过分析比较相关数据,对群体化搜索引擎的应用进行了可行性和服务性的分析。,对群体个性化搜索引擎进行系统实现,重点介绍了群体个性化搜索引擎几个重要模型的设计与实现,如用户模型的设计与实现,个性化查询扩展模块,个性化排序模块等。⒃谙低呈迪值幕∩希直鹩氪乘阉饕婕案鲂曰阉饕娼辛搜索结果比较,分析了群体个性化搜索引擎的优缺点。本文的研究内容将为个性化搜索引擎指出一个全新的发展方向,为搜索弓擎的进一步发展提供~个新的理论平台和开端。关键词:个性化信息采集,个性化查询,搜索引擎,群体个性化
甒,琖’—甒琣,琤,,甅瑃琣琤瓵,‘瓵瓵—,琾瑃甌琭’●
,,,瑃,,,,疭,..:,
导师┟:邓掌诰馈!ぶб言艾学位论文使用授权书独创性声明期:竺:墨及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他入已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作本人完全了解武汉理工大学有关保留、使用学位论文的规定,即学校有权保留许向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权武汉理工大学可以将本学位论文的全部内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存或汇编本学位论文。同时授权经武汉理工大学认可的国家有关机构或论文数据库使用或收录本学位论文,并向社会本人声明,所呈交的论文是本人在导师指导下进行的研究工作了明确的说明并表示了谢意。公众提供信息服务。研究生┟:
第绪论课题研究背景网络无时不在。如今,网络已经逐步走进人们的工作和家庭,成为生活中不可缺少的一部分,网络应用也已经渗透到了工作、学****生活等方方面面,网络的用途也越来越日常化。人们可以通过网络随时随地方便快捷的共享大量的信息资源,互联网给用户提供了一个巨大的信息资料库。因为它这种灵活的使用形式,以及其巨大丰富的信息量,逐渐成为人们获取信息资源的一个重要来源,极大简化了用户的操作过程,较好的满足用户需求。据相关数据统计,现阶段,中国网民总数达到我国总人口的近一半,而搜索引擎用户比例占中国网民总人数七成,而且这个比重还在日益增大俊T诖蠹胰粘5墓ぷ鳌⑸生活中,都要用到互联网的应用服务,而且随着时间的推移,这个用户群将会越来越多越来越广,网络应用也将由基础走向专业化和个性化。搜索引擎的应用可以帮助用户从不计其数的网络信息中查找用户需求的相关信息,它从网络大量的信息中查找出与关键词相互关联的信息,然后进行收集来建立搜引数据库,以此来满足用户搜索请求。目前市场上主流搜索引擎,例如对中国客户最熟悉的芄唤衔?捷方便的帮助用户寻找到所需的信息资讯,一定程度上满足了互联网用户的相关需求,从而深入广大用户欢迎。但传统的搜索引擎其商业特性决定了其简单性和广博性,它的服务笼统、不区分对象,提供的只是一个初始化搜索服务,面对搜索结果需要用户自行检验,越来越不能满足各种用户不同的个性化需求。我们在传统搜索引擎的使用过程中只要输入相同的关键词,所有用户都会得到一样的用户界面和同样的信息。而且在这些返回到用户的搜索结果中,不仅大量重复,还包含着许多无用的乃至损坏的信息和链接,用户