1 / 51
文档名称:

个性化Web信息检索系统的研究与实现硕士论文.pdf

格式:pdf   页数:51
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

个性化Web信息检索系统的研究与实现硕士论文.pdf

上传人:1322891254 2014/6/29 文件大小:0 KB

下载得到文件列表

个性化Web信息检索系统的研究与实现硕士论文.pdf

文档介绍

文档介绍:西安电子科技大学
硕士学位论文
个性化Web信息检索系统的研究与实现
姓名:李县
申请学位级别:硕士
专业:计算机软件与理论
指导教师:徐学洲
20080101
摘要畔⒓焖魇荳信息集成系统中不可或缺的一部分,其目的是从网络上的海量信息中,筛选出满足用户需求的信息。如何为用户提供高质量和高效率的个性化信息服务,已成为畔⒓焖飨低臣毙杞饩龅奈侍狻H欢钟械母鲂曰信息检索系统还存在以下不足:一是对用户兴趣的学习和表达的自动化程度不高,要求用户输入私人信息并需要用户提供大量的反馈信息,不能很好的适应用户需求的变化;二是缺乏对所检索的关键词在语义上的分析和处理,即存在“忠实表达”问题和“表达差异”问题。本文在研究个性化畔⒓焖飨喙丶际醯幕∩希攵韵钟械母鲂曰畔检索系统存在的问题,提出了一种新的基于用户兴趣的个性化畔⒓焖鞣椒ā采用自动隐式学习方式来建立和更新用户兴趣模型,检索系统在无需用户参与的情况下,可以准确获得用户的兴趣,并及时进行动态更新。同时,引入本体技术来解决语义上的问题,将现有的基于关键词层面的信息检索提高到基于知识或概念层面的信息检索。文中给出了个性化畔⒓焖飨低车奶逑到峁梗婷枋隽烁鲂曰拇过程,详细介绍了个性化畔⒓焖飨低车纳杓坪褪迪郑詈笸ü笛槎圆檠结果的质量进行了评测,分析了用户的个性化信息对查询结果的影响。评测结果表明文中提出的个性化畔⒓焖飨低晨梢源锏浇细叩募焖髦柿浚芨玫芈足用户的需求,为其提供个性化服务。关键词:信息检索个性化用户兴趣本体信息集成
.曲琣痑‘‘’琣痭,,瓾瓼,甋瑂甋.:甀’.,
本人签名:盔皇本人签名:几日期迎堡:学位论文创新性声明关于论文使用授权的说明本学位论文属于保密,在——年解密后适用本授权书。日期幌ǹ诳螅。秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。C艿穆畚在解密后遵守此规定注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成明并表示了谢意。导师签名:
⒓筛攀信息集成技术经历了二十多年的发展过程,研究者已提出了很多信息集成的体系结构和实现方案,然而这些方法所研究的主要集成对象是传统的异构数据库系统。随着姆伤俜⒄梗缪杆俪晌R恢种匾5男畔⒋úズ徒换坏氖侄危尤其是在希凶偶浞岣坏氖堇丛础H绾位袢上的有用数据并加以综合利用,即构建畔⒓上低常晌R桓龉惴汗刈⒌难芯苛煊颉实现信息集成系统的方法主要有两种:数据仓库方法和疢数据仓库方法就是将各个菰醋叭胧莶挚猓⑻峁┒哉飧鍪莶挚的检索机制。各数据源的数据按照需要的全局模式从各数据源抽取并转换。当数据源发生变化时,数据仓库中的数据也随之作相应的修改。对于数据源数目不是很多的单个企业来说,该方法十分有效,但缺点是数据更新不及时、数据重复存储。采用数据仓库方法建立的畔⒓ú⒉唤ǜ魇菰吹氖菁存放,而是通过疢峁孤闵喜慵捎τ玫男枨蟆U庵址椒ǖ暮诵是中介模式。信息集成系统通过中介模式将各数据源的数据集法【。琂#!!!#ⅰⅲ!##琂
圄圄圄剧恻剧鯹疢椒疢椒ǜ视τ谑菰词慷唷⒏骶植渴菰吹淖灾涡院芨叨沂成起来,而数据仍存储在局部数据源中,通过各数据源的包装器对数据进行转换使之符合中介模式。用户的查询基于中介模式,不必知道每个数据源的特点,中介器将基于中介模式的查询转换为基于各局部数据源的模式查询,它的查询执行引擎再通过各数据源的包装器将结果抽取出来。最后由中介器将结果集成并返回给用户。采用疢椒ń⒌腤曲信息集成系统结构如图所示。疢椒ń饩隽耸莸母挛侍猓菸扌璞恢匦赂粗魄铱杀V每次查询的结果为最新数据,从而弥补了数据仓库方法的不足。因此,据经常变化的肪场畔⒓焖畔⒓焖魇荳信息集成系统中的一个重要组成部分。信息检索的目标是在较少消耗情况下,快速、全面、准确地返回用户感兴趣的信息。畔⒓索的质量直接影响到畔⒓上低车男阅堋人们在进行畔⒓焖鞯氖焙颍皇瞧谕业剿杏敫行巳さ闹魈庀喙氐文档,即期望获得高查全率;二是希望不包含和主题无关的文档,即高查准率2槿屎筒樽悸