1 / 70
文档名称:

基于概念格的个性化搜索引擎查询扩展研究(可复制论文).pdf

格式:pdf   页数:70页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于概念格的个性化搜索引擎查询扩展研究(可复制论文).pdf

上传人:mkt365 2013/11/11 文件大小:0 KB

下载得到文件列表

基于概念格的个性化搜索引擎查询扩展研究(可复制论文).pdf

文档介绍

文档介绍:知识水坝***@pologoogle为您整理
第一章绪论选题背景研究范围和主要内容计算机技术的发展,尤其是网络技术的发展,极大的推动着互联网的普及。互联网深刻地改变着人们的生活和思维方式,互联网已经成为人们不可缺少的信的信息为最终目的的个性化服务技术和信息检索技术引起众多学者的研究。联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,提供有用的信息,从而起到智能信息查询导航的目的。越来越多的研究者的关注,研究者提出了基于概念格的信息检索模型。,由两部分组成:外延,即概念所覆盖的实例:内涵,即概念的描述,也就是概念实例的共同特征。概念格的忌图蚪榈靥现了这些概念之间的层次结构关系。因此概念格被认为是进行数据分析的有力工息来源。然而互联网是一个高度开放、异构、分布式的信息空间,没有统一的管理,信息杂乱地散布在全球的各个站点上,而且每天以极快的速度更新。互联网的高度无序性给信息的使用带来了极大的困难。于是以帮助用户寻找自己感兴趣搜索引擎撬孀臰信息的迅速膨胀而发展起来的网上信息检索工具。如何有效、合理、实时地利用网络的信息嗣亲匀换嵯氲剿阉引擎这一工具。在数据挖掘和信息检索中,搜索引擎是关键技术之蚨运索引擎中搜索、索引、查询等技术的研究在数据库和信息科学等领域中变成了一个重要的研究方向。搜索引擎正是为了解决这些问题而出现的技术。搜索引擎如何融入人的智能,以及在获取有价值网页中如何体现人的智能搜索行为已经成为计算机工业界和学术界竞相研究、开发的对象。智能搜索引擎以一定的策略在互基于概念格的理论和应用的发展拍罡裨谛畔⒓焖髁煊蛞鹆形式概念的结构挖掘网页中概念的关系,并具有可视化的特点,因此是智能搜索的解决方法之一,受到越来越多研究者的关注。概念格,也称为格,又叫做形式概念分析S蒞淌晔紫忍岢鯷,它提供了一种数据分析北京邮电大学硕士学位论文
增量式生成算法生成概念格的算法可以被分两类:批处理算法批处理算法大多都是先生成形式背景所对应的所有概念,然后再决定概念之间的子概念——超概念连接关系。目前主要的批处理算法有:惴ǎ珿算法,算法,惴ǎ琋算法以及算法和算法等。,从空格开始,通过不断地渐增惴ǎ珻惴ǖ取·基于以上算法,构建方式有两种:全局建格和局部建格。。大多数的经典聚类算法不能用于用户兴趣聚类,但是对于惴ǎ劾嗖问齂就是用户的不同兴趣的个数,普通的用户完全可以给出聚类参数慕浦祷蚓分担蚨梢钥悸怯肒算法来进行的精确值,而只能以近似值代替,因而导致甿算法聚类建立的细兴趣粒度用户模型的质量不高。现有的用户模型表示方法无法在形式语义的框架内讨论基于概念格的个性化检索,无法在概念格中体现用户兴趣,特别是用户兴趣的细兴趣粒度表示。为了解决以上问题,本文对面向个性化服务的用户兴趣技术进行了研究,提出了基于概念的用户建模方法,并提出维护和更新算法。通过分析,指出了基于概念格的用户建模算法的优越性。目前网络搜索引擎多为基于关键词或简单信息主题分类,造成信息查全率和检索意图往往存在较大的差异,其中这方面的差距主要来自于以下三个方面:①用户缺乏特定问题领域的知识:②用户不愿意或者难以形成、提交足够复杂的查具。;增量式算法形式背景中的对象来实现对概念格的渐进式构造。目前主要的渐进式算法有:很好解决全局建格所造成的效率低下的问题。.现有的自动用户建模技术存在三点不足之处:聚类参数蛔既为了得到用户模型的兴趣粒度表示,需要对用户兴趣进行聚类,聚类质量直用户兴趣聚类。由于用户可能不能给出不用兴趣的个数的精确值,┱查准率都存在问题。在以往基于关键词的信息检索中,用户的查询表示与实际的。北京邮电大学硕士学位论文第一章绪论’
论文内容安排词相对比较短,通常局限在三个关键词以内:③目前的搜索引擎不能解决自然语针对传统查询扩展方法无法同时解决词的同义性和歧义性问题,本文提出了第二章介绍了搜索引擎的发展情况,查询扩展的研究现状。研究了概念格第三章利用概念格构建基于概念格的用户兴趣建模的方法,探讨基于概念第四章提出概念格在信息检索查询扩展方面的创新应用,探讨基于概念格第五章针对第四章的模型系统,构建基于概念格的查询扩展系统平台。介询关键词,这就是所谓的短查询问题。据统计,用户提交给搜索引擎的查询关键言中词的歧义性问题。因此,为了提高检索的满意度,关键的问题是能够帮助用户形成有效的查询机制,使该查询能够更好的反映用户的检索意图。近年来出现的查询扩展取得了较好的检索效果。查询扩展是近年来在畔⒓焖髁煊蛭解决短查询和词的不匹配问题所研究的中心问题。查询扩展虽然在方法上有了很大的改进,然而却不能实质性的提高信息检索的性能。基于概念格的