1 / 70
文档名称:

搜索引擎个性化查询服务研究.ppt

格式:ppt   页数:70页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

搜索引擎个性化查询服务研究.ppt

上传人:钻石文档库 2013/9/14 文件大小:0 KB

下载得到文件列表

搜索引擎个性化查询服务研究.ppt

文档介绍

文档介绍:搜索引擎个性化查询服务研究
1
目录
引言
相关研究
自动中文网页分类
用户访问模式
个性化查询服务
进度安排
演示
2
引言
研究背景
问题的提出
技术路线
系统的体系结构
系统的数据源及特征
3
研究背景-1
, 首次提出World Wide Web的概念
1990年9月,基于文本的第一个原型开始运行
1993年2月,
1995年4月, 上的第一大应用服务
1997年12月,网上大约有3亿2000万网页
2000年2月,不重复网页超过10亿
2002年6月,Google索引超过20亿网页
4
研究背景-2
国内,
2002年1月,上网计算机1,254万台,专线上网计算机数为234万台,拨号上网计算机数为1,020万台。个。上网人数3,370万
“天网”估计目前网页数已经超过5000万
:数量大,准确性低
目录式:数量受限,准确性高
5
问题的提出
不能提供目录式导航服务。用户希望Spider式搜索引擎同时能够提供目录导航服务。
检索结果中无关或无用的网页过多。大约有一半的结果是无关的。80%用户仅对前2页的查询结果感兴趣。
没有考虑用户的特性。如果输入相同的查询条件,搜索引擎就会返回相同的结果。用户希望能够提供个性化服务。
6
技术路线
图 1 技术路线
三个方面的问题
网页自动分类
用户访问模式
个性化查询服务
7
系统的体系结构
图 2 系统的体系结构
8
系统提供的服务
目录式导航服务
重品级(Re-Ranking)及过滤(Filtering)服务。重品级:根据不同用户的访问模式,调整检索返回的URL的权重。使用户感兴趣的URL被排列在查询结果的顶端。
投递(Delivering)或推荐(mendation)服务
9
系统的数据源及特征
数据源
搜索引擎收集的网页
用户静态信息:用户注册信息
用户动态信息:用户访问日志和用户访问网页时的反馈信息等
特征
海量
动态性
不规则性
10