文档介绍:大连理工大学
硕士学位论文
P2P网络中Top-k查询算法的设计与实现
姓名:于文婷
申请学位级别:硕士
专业:计算机系统结构
指导教师:李克秋
20091201
摘要近年来,随着信息技术的迅猛发展,信息资源极大丰富,如何在动态的缁境中对海量数据进行查找引起了很大的关注。檠褪谴邮烤薮蟮男畔⒅醒≡最符合查询条件的鼋峁氏指没В琓—檠魑R恢中碌牟檠际跻鹆搜界广泛的关注,主要包括聚合式檠头蔷酆鲜絫查询两种。然而现有的聚合式甼查询算法只按照分值标准选择合适的对象返回给查询节点,相同的阈值标准没有考虑到节点数据分布情况,非聚合式甼查询算法只能排除非法节点,不能排除有效节点中的非法对象。针对聚合式檠娜毕荩韭畚奶岢隽艘恢只赑网络的混合非一致阈值聚合阉魉惴℉置选择标准和分值选择标准,通过对每个节点重新定义阈值,并且对每个对象估计极大值和极小值,通过比较当前甼和候选集中对象的极大值,除去候选集中的非法对象,达到减少非法对象传输的效果。针对非聚合式甼查询,⒔峁ü刂撇檠复数量的方式来减少带宽消耗。最终通过实验评估和性能分析表明本论文提出的算法在网络带宽消耗和查询响应时间方面要优于其他同类方法。关键词:纾恢狈酵迹痪酆蟃查询;非聚合猭查询,岷衔猭大连理笱妒宦畚畊
瓽篜缰蠺查询算法的设计与实现猭..甀,.甌猘.,甀籋;猭:畐..。,甌廿
日期:辍簧隆Q稳学位论文题目:竺陛£因丝王马唑壅翅笪堕鱼蒹斡闳盈塞够大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。作者签名:
导师签名:—蔐日期:—型耻年—丝月丑日日期:塑乒年堡月堑日垒丝里固缝生垃垦壅固笪区鱼鲇闳痾盈叁筠大连理工大学学位论文版权使用授权书本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印、或扫描等复制手段保存和汇编本学位论文。学位论文题目:作者签名:大连理工大学硕士学位论文
绪论背景问题的提出和研究内容由于缑挥兄行姆衿鳎换嵋蛭7梦手行姆衿髟斐赏缬等庵治蘅替代的优势引起了很大的研究热潮。随着计算机硬件和软件性能的提高,发出的请求在所有节点上都可以进行计算和处理,这也是缱畲蟮挠诺恪的应用广泛,在用户间协作,资源共享和网格计算等发面都发挥了很重要的作用。缤被箍梢增强整个计算机系统的可靠性和容错能力。目前大部分芯慷技俣ㄋ薪诘愦砗处理能力是一样的,但缰写嬖谧糯砟芰托阅芏疾煌慕诘悖哂薪锨考扑能力和较大带宽的节点被称为超级节点。考虑到这种差异性,在动态网络中把所有的节点都看成一样是很不合理的。面对日益丰富的信息资源,用户在获取信息上面希望能够从海量数据中迅速找到少量最具有价值的信息,而不用让用户从头至尾的逐一挑选【俊U庵钟没枨笸贫艘滴系统在信息处理方式上的转变。许多数据密集型应用己不再追求搜索结果的完整性,而只关注如何从海量的数据中快速查询用户最为关心的少量信息。甼查询是根据用户指定的聚集函数サ从数据集中检索出函数值最高的前鼋峁@绲鼻暗慊髁在前名的网站。在许多数据密集型应用中,普遍存在的用户需求是快速搜索用户最为关心的少量结果。这个问题在信息检索领域得到了很好的应用与研究。例如,在使用搜索引擎时,用户都能在返回的页面中找到想要的结果。针对该问题,上世纪年代末,热私杓畔⒓,查询引擎只需要找出这些少量数据即可,由此优化查询处理算法,减少带宽消耗并提高查询处理效率。甼查询也是当今搜索的热点问题,檠褪遣檎易盥悴檠膋个结果。甼不关心满足查询条件的所有结果,只是关心满足条件的前鼋峁ù蟮募跎了查找的时间,只要满足条件的甼结果出现后,即可停止查询。由于返亩时,尽量减少带宽消耗和减少访问节点的个数,已经成为一个重要的思考问题。基于聚集排序的檠目前阉鞑檠闹髁骷际跏且訲惴ㄎ4淼幕诰奂判虻膖查询。其核心思想是对每一个对象按照属性评价的降序进行排序,然后采用随机访问和顺序访大连理工大学硕士学位论文态性和可扩展性,为缰械腡查询带来了一些挑战。如何在提高准确率的同
论文章节组织结构问这两种方式在各个节点数据序列上获取数据,计算