文档介绍:基于信息集结算子的眯畔⒓焖鞣椒ㄑ芯摘要研究生姓名:武兴龙信息检索的研究已有多年历史,籛产生以来,如何在海量的信息资源中检索到有用的信息更成为一个非常重要的课题,同时这方面的研丫惴河τ糜诰霾叻治觥⒆ḿ蚁低场⑷斯ど窬⒛:低车确矫妗K提供了广泛的包括极大、极小和算术平均的参数化集成算子,并可以应用于各种信息集成问题中。如何将τ玫絎信息检索是一个非常值得考虑的问题。分为霾愦危ǎ核阉饕嬗肽柯肌⒃K阉饕妗⑿畔⒓焖鰽。本文就是按照搜索引擎、元搜索引擎、霾愦翁岢隽嘶贠算子的畔⒓焖髂型,旨在寻找提高网络信息检索效果的手段和方法的有效途径,并最终提高网络信息综述,为下文的进一步研究奠定了基础。第二章详细阐述了畔⒓焖鞑愦畏掷啵的关键词频率一逆频率狪桨福檠泶锸接么惺秩ㄖ氐募焖鞴丶时示。然后采用自下而上的匹配策略,用调整的几何平均算子和有序加权平均算子进行信息集结,最终得到了每个文档对查询表达式的检索值。第四章建立了基于用户查询含语言值权重的扩展的布尔信息检索模型,这个模型与上个模型的不同在于在查询语句中用语言值权重代替数值权重。匹配策略也是自下而上的,最终得到了每个文档对查询表达式的检索值。第五章建立了基于薪峁诤系脑K阉引擎模型。本章中用阕咏薪峁诤希菏紫燃扑忝科N牡翟诿扛龀稍彼阉叫畔⒃吹奈甯霾愦危⒏隽斯ぷ髁鞒蹋渲杏玫絆算子。第七章是结论和展望。另外,本文对每个模型都有简单的算例,以便更好的说明算法。关键词:畔⒓焖鳎┱沟牟级P停K阉饕妫畔⒓焖鰽,导师姓名:刘新旺东南大学究也有了一定成果。岢龅挠行蚣尤ㄆ骄阕畔⒓焖飨低匙魑S没Р愫蚖信息层之间的中间层,可以进一步地划的检索效果,使得网络信息资源得到充分有效地利用。全文主要包括七个部分:第一章对信息检索及畔⒓焖鞯难芯肯肿唇辛介绍了几种传统信息检索模型,包括布尔模型、向量模型、概率模型、概念模型,并且阐述了畔⒓焖髦械男畔⒓晌侍猓凼隽烁髦中畔⒓崴阕印5谌绿岢了用户查询含数值权重的扩展的布尔信息检索模型。此模型中,文档采用了一种改进引擎各自的检索结果中的位置值,然后针对位置值的大小进行结果的集结,即融合。第六章建立了一个信息检索P停媚P椭胁髁舜佑没
甀膁.,,.畊瑆舀,—甶::瓾..,瑆甋甌鰎甌瑃Ⅵ,甌:.—..,
:鷌瑆瓸,,
研究生签名捌当如师签名:期:迦乙坛东南大学学位论文独创性声明东南大学学位论文使用授权声明研究生签名:本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特疛员曜⒑椭滦坏牡胤酵猓畚闹胁话其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布ǹ论文的全部或部分内容。论文的公布括刊登谌ǘ洗笱а芯可喊炖怼
第一章绪论研究背景个集合:匹配集和非匹配集。继而又产生了其他的模型例如向量空间模型【删,概率模信息检索的研究已有多年历史。早在上个世纪年代,当计算机被图书馆等部门用于存储和管理文档时,信息检索就作为一个研究领域面诞生了。到了年代以后,信息检索领域在索引模型,文档内容表示以及匹配策略等方面取得了许多研究成果。。这些变量对应文档中的特征项,一般是由文档集中的词条或短语组成,如果词条对文档内容有贡献则赋予,否则为<索时,根据用户提交的检索条件是否满足文档表示中的逻辑关系将检索文档分为两是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络。网上信息服务大致可分为两类:一类为信息交流服务,如、新闻组与讨论组、公告板等;另一类为信息查询服务,主要有現,以及,取作为最重要的一种形式,可以为用户提供多种多样的信息服务。目前,用户对上纷繁复杂的信息的查我,主要是通过系男畔⑺阉鞴ぞ呃赐瓿傻摹由欧洲量子核物理实验室开发出来,且桓龇植际降摹⒒诔教宓腎信息浏览工具。它给用户提供一个友好的界面来获取信息和服务。用户可以通过床檠疐件传送协议牡怠⑹菘庖约癎衿魃系淖试础K阉饕媸浅缱佑始外的最重要的网络服务。所谓畔⒓焖合姓业接敫ǖ牟檠肭驫相关的、恰当数目的文档子集<萕的过程对应于一个映射虫:,一S氲湫偷氖菘庀低巢煌琖信息检索的处理构化的多媒体的信息:畔⒓焖鞯姆穸韵笫恰坝没А保牡导舷喽跃仓梗户查询请求却是动态变化的;信息检索的处理目标是“发现相关信息”,要求“部分匹型取年,侵复哟罅縒文档的集对象是“文档资源”: