文档介绍:要摘近年来,信息检索技术的出现,给人们获取信息带来了极大的方便,而谛畔管理、电子商务、移动通信、网络教育、电子文档交换等诸多领域也有很广泛的应用。本文设计了一个基于囊贫畔⒓焖飨低常饕0ㄋ饕獾慕ⅰ⒐丶始尤ā检索、相似度计算几个部分。尽管目前基于男畔⒓焖髂P脱芯坑胗τ靡丫〉昧撕艽蠼梗诩焖鞣矫仍然存在一些问题,如何能使权重更加反映用户的需求,如何能够使检索的查全率与查准率获得提高,如何能够使牡到峁购湍谌菪畔⒌玫匠浞值耐诰颉针对上述问题,本文根据实际需求,在深入研究分析与向量空间模型的基础上,建立了基于内容和结构的倒排索引库,并将各种加权方法应用到畔⒓焖髁煊蛑校提出了领域词典加权、结构位置、节点距离加权共同作用进行加权的方法。文中详细描述了基于模型的原型系统的总体设计、实现和相关的算法。本论文的主要工作如下:⑻岢隽嗽拖低车目蚣苌杓疲⑶医樯芰舜嗽拖低车纳杓扑悸贰⒓际趼废咭约各个主要的模块的功能。⒏隽怂饕獾慕⒎椒ā⒐丶始尤ǖ娜植煌椒ǖ慕岷瞎健⒉檠胛牡之间的相似度计算、检索以及移动设备接口实现的主要算法。⑹迪至艘桓龌赬的移动信息检索系统,利用平台实现,并应用和实现移动客户端数据的传输以及对数据库的访问。⑼ü哉倩芈室痪仿恃O叩氖萁蟹治觯治鲈拖低扯杂谡倩芈屎途仿的提高。本研究工作的开展,主要是为了解决现实问题,满足当前应用需求,同时积累系统开发研制的经验。基于囊贫畔⒓焖髂P偷难芯坑肟7⒕哂幸欢ǖ挠τ眉壑岛脱术价值。关键词:幌蛄靠占淠P停灰贫畔⒓焖鳎还丶旨尤大连理:搜妒垦宦畚
,鷕瑀鷕瑂篨;籑王艳萍:基于囊贫畔⒓焖髂P脱芯,猙瓵,猚琺,.,’猟甌瑃簍.:琱,,瑃甌,.——.Ⅱ
作者签名:量监日期:蒯.,.独创性说明作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。
碰年』月上日大连理工大学学位论文版权使用授权书本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。作者签名:导师签名王艳萍:基丁囊贫畔⒓焖髂P脱芯
信息检索技术的出现,曾一度给人们带来晾喜,并且目前也被广泛应用。但由于多信息检索基本概念问题的提出随着及相关技术的发展与成熟,在网络上检索信息已成为当今以至未来社会人们获取信息的重要手段,环球信息网是的关键技术之一,也是上最受欢迎,最为流行的信息检索系统。其目的是开发一个在全球范围内易于访问的跨计算机平台的分布式超媒体系统。它能够把各种类型的信息资源有机地结合在一起,使用户能够在上查找已建立在网络服务器上的超文本,超媒体资源文件。网络上的信息量不断积累,网络的信息需求也在不断增加,已经不能够单纯地靠手工查找或组织所有的信息,人们迫切需要能够快速、准确、经济地查找某个主题全部信息的信息检索系统。数信息检索技术处理信息的方法都比较原始,即通过对页面迸行索引和关键词匹配来满足用户的检索请求。这种方法有其自身难以克服的缺点:任何一个信息检索系统的索引也无法覆盖整个网络资源,因而,其返回结果是不完全的:由于采用简单的关键词匹配模式,信息检索系统对一条检索请求可能返回数以千计的结果,而且其中常涉及一些无关的结果,用户必须在此基础上对结果进行二次筛选,这不仅增加了用户的负担,同时也降低了处理效率。因而,人们期待着更为有效的信息检索工具的出现。新的信息检索工具应尽可能满足不同用户的个性化需求,在检索的准确性和有效性方面达到要求。.畔⒓焖鞯哪康信息检索是指将信息按一定方式组织和存储起来,并针对信息用户的特点需求查找出所需信息内容的过程。广义的概念包合了信息存储和检索两部分。.畔⒓焖鞯睦嘈信息检索的类型有多种划分方法,按检索结果的内容来划分,信息检索可划分为:文献检索是目前信息检索的主要形式,它是通过二次文献,包括传统的以纸张为存储介质的手工检索工具和大量的以光、电、磁为存储介质的现代计算机检索系统,找出所需的一次文献或三次文献。数据检索是以数据为对象的检索,如查找某一数学公式、数据火连理工人学硕士学位论文
图表、某一材料的成分、性能等都属于数据检索的范畴。是一种确定性检索。事实检索是以特定的事实为检索对象。事实内容包括大量的科学事件和社会事件。概念检索就是查找特定概念的含义、作用、原理或使用范围等解释性的内容或说明。.畔⒓焖鞯脑从本质上讲