文档介绍:元搜索引擎中检索结果优化策略的研究硕士学位论文学科专业让篡扭筮鲑皇理途室虹蓬羞班究虽周小平指导教师分类号耆论文答辩日期生§目鼓浚皇谟枞掌生旦答辩委员会主席星渔鹏盟究虽论文评阅人丞昌塞数援杨题数援
/螂煳掣必滦吾爸。芗。论文作者签名:闻吩校銲,学位论文使用授权说明广西大学学位论文原创性声明和学位论文使用授权说明学位论文原创性声明:痮年多月廴本人声明:所呈交的学位论文是在导师指导下完成的,研究工作所取得的成果和相关知识产权属广西大学所有。除已注明部分外,论文中不包含其他人已经发表过的研究成果,也不包含本人为获得其它学位而使用过的内容。对本文的研究工作提供过重要帮助的个人和集体,均已在论文中明确说明并致谢。论文作者签名:本人完全了解广西大学关于收集、保存、使用学位论文的规定,即:本人保证不以其它单位为第一署名单位发表或使用本论文的研究内容;按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的的前提下,学校可以公布论文的部分或全部内容。请选择发布时间:口即时发布口解密后发布C苈畚男枳⒚鳎⒃诮饷芎笞袷卮斯娑导师签名:门,、.
元搜索引擎中检索结果优化策略的研究摘要近年来,随着网络的大量普及以及各种技术的快速发展,互联网上的信息呈爆炸性增长。人们要在网上快速查找自己想要的资料越来越困难,搜索引擎的出现为解决这一难题提供了方便。然而,独立搜索引擎所覆盖的信息面相对来说,还不够宽。随着网络的迅猛发展,独立搜索引擎越来越显得力不从心。为了改变这一状态,元搜索引擎伴随着人们的需要就产生了。元搜索引擎所覆盖的信息范围相对而言比较广,在一定范围内能提高了检索结果的查全率以及准确性。它吸引着人们的浓厚研究兴趣,成为信息检索研究的热点之一。而由于元搜索引擎所选取的各成员搜索引擎在检索方式、排序算法等方面采用不同的方法,这就造成了在对返回结果进行相关处理时比较困难,所以它也是信息检索研究的难点之一。本文在深入研究元搜索引擎的相关技术基础上,提出了基于用户偏好的摘要/位置的结果排序算法和基于网页正文主题和摘要的网页去重算法。首先,简述了元搜索引擎的运作原理和分类,研究了元搜索引擎的核心技术,并阐述了它的不足以及未来发展趋势。其次,在深入研究元搜索引擎返回结果常用排序算法的基础上,提出了一种改进的基于用户偏好的摘要/位置排序算法。该算法不仅能体现出查询词与主题、摘要的相关度,而且能体现出用户对成员搜索引擎的偏好。.
实验表明,该算法具有明显的优势,更能满足用户的个性需求。再次,利用模糊匹配的思想,引入分词,提出一种基于网页正文主题和摘要的网页去重算法。该算法首先对各成员搜索引擎返回来的网页标题进行有关处理,提取出网页的主题信息,然后对主题、摘要进行分词,再分别计算主题、摘要的相似度。二者结合能更好地体现出文章摘要的内容,实现网页去重。实验表明,在网页去重方面,比起基于传统特征码的去重算法,该算法具有明显的优势,更接近人工统计结果。最后,设计出整个元搜索引擎系统,验证算法的有效性。关键词:元搜索引擎成员搜索引擎结果排序网页去重
甅琲琒,琤,.甌瓸瑆.,瑃’琣甀
..,,瑃;,,瓻,,琣,’
簃琲;;琩;
录目摘要⋯⋯..⋯⋯⋯⋯.......。..⋯⋯.。.....。.⋯⋯⋯⋯⋯⋯⋯....⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..第一章绪言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯研究的背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第二章元搜索引擎相关的知识⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。元搜索引擎的概念及工作原理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。元搜索引擎的关键技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。成员搜索引擎的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.检索结果的去重⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯元搜索引擎的不足⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..元搜索引擎的发展趋势⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯