文档介绍:太原理工大学硕士研究生学位论文
隐交互式个性化搜索引擎研究
摘要
随着姆伤俜⒄购驮谌澜绶段У钠占埃嚼丛蕉嗟男畔⒉欢霞
入到网络中,在信息极大丰富的同时,用户面临着“信息过载”和“资源
迷向”的问题。“面向用户”的个性化搜索引擎成为解决上述问题的关键,
个性化搜索引擎及其个性化服务技术成为了当今的研究热点,并且取得了一
定的研究成果。
本文介绍了个性化搜索引擎的研究现状、关键技术以及现有个性化搜索
引擎的不足,通过分析用户在使用搜索引擎时的行为特征,提出了一种新
的基于隐式用户信息收集和隐式反馈技术的个性化搜索引擎研究框架——
隐交互式搜索引擎,
做了如下几方面的工作:
第一,描述了隐交互式搜索引擎的工作原理,提出了隐交互式搜索引
擎的三层系统体系结构以及各层之间的通信机制。
第二,介绍了建立在隐交互式搜索引擎体系结构上的用户隐式信息收
集方法、收集的内容和存储方式。描述了建立在收集到的用户信息基础之
上的用户描述文件建立的方法和步骤,提出了基于用户描述文件的用户建
模方法和基于用户兴趣度的查询扩展方法。
第三,通过隐式收集用户的即时反馈信息,提出了一种基于隐式反馈
技术的用户模型更新方法;通过分析用户行为的特征和搜索引擎排序的特
点,提出了一种基于用户缓存的个性化排序方法;根据用户的行为特征和
太原理工大学硕士研究生学位论文
个性化搜索引擎的特点,提出了两个评价个性化搜索引擎性能的评价指标:
用户行为指数和用户行为准确率。
最后,本文实现了一个隐交互式搜索引擎,证明了隐交互式搜索
引擎体系结构的可行性,另外,通过收集用户的查询信息和点击信息,证
明了基于用户兴趣度的查询扩展方法在某种程度上提高了成员搜索引擎的
查准率,通过平均用户行为指数和平均用户行为准确率两个评价指标,证
明基于用户缓存的个性化排序方法具有一定的优越性,同时也表明两个评
价指标的一致性。
关键词:隐交互式搜索引擎,用户行为,查询扩展,用户模型,个性化排
序
太原理工大学硕士研究生学位论文
第一章绪论
引言
由于互联网姆伤俜⒄购驮谌澜绶段У钠占埃嚼丛蕉嗟氖菘夂托畔
不断加入到网络之中,⒄刮
当今世界上资料最多、门类最全、规模最大的信息库和全球范围内传播信息的主要渠道。
猿谋镜男问匠氏指没Ц髦指餮男畔ⅲ钩闪艘桓鲆斐E哟蟮木哂幸旃
性、动态性和开放性的分布式数据库.
然而,在信息极大丰富的同时,用户也面临着“信息过载”和“资源迷向”的问题
【.系男畔⒐谂釉樱揖哂胁晃榷ê捅涠斓奶氐悖挥幸膊豢赡苡幸
,面对缤纷复杂的网络空间,面
对信息的海洋,用户往往感到无所适从,不知道如何去获取自己需要的内容.
系奈牡狄话愣际峭ü唇咏峁够ハ嗔O灯鹄吹模柚鶬榔骼
浏览趁娴哪谌荩庵咒婪绞绞屎嫌谀康牟幻魅贰⑹奔湟G蟛唤羝鹊那榭觯
需要查找一个具体的内容时,效率很差,一般不能在短时问内获褥所要的信息,特别是
对惶煜ぁ⑷狈ι贤榈挠没В虼耍没酝纪ü繵来发现信息
已经变得非常困难,往往花费了很多时间和精力却所获甚少,人们期待效率更高的信息
获取工具的出现.
自年第一个搜索引擎在网上正式发布并开始服务以来,搜索引擎
己经成为发展最快、,查询
算法简单,效率不高,,搜索引擎开始进入。容
量建设期”,
国科学院网首次与互联网互联到现在的十多年时间里,出现了诸如百度⑼缰
、速度上国内的搜索引擎与凡家大型搜索引擎有一
定的差距,
.
当前,搜索引擎正经历着从。数量累积”向。质量精炼”的变革口】.随着
上的信息数量呈指数级增长,
,它们的∑淇赡艿陌迅骼嗤匙セ乩矗痪虻サ募庸ず蟠娣诺绞据库中备检:另外,搜索引擎直接提供给用户的检索途径大多是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献。这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这也就是现在经常谈论的“信息过载气“信息超载”