文档介绍:摘要可能的拓扑结构种类,提出了一种新的数据格网复制定位机制——分布式复制索引定位机数据格网关注于数据密集型的格网应用,致力于数据的集成和有效访问。在数据格网中,根据给定逻辑文件标识给出一个或多个包含该文件内容物理位置的问题称为数据格网中的复制定位问题。本文介绍了数据格网复制定位研究的现状,总结了数据格网复制定位制。基于改进环型拓扑结构,包含以下旨际酰褐氐缂际酢压缩技术、软状态协议和⒘兴惴ā1疚南晗该枋隽薉母鞲鲎榧美郈语言描述了这些组件的工作过程,并设计了原型系统中主要的1疚幕咕虳杂肫他复制定位机制的性能进行了比较:定性分析表明,较之其他机制具有较好的可扩展性和安全性:定量分析表明,具有较短的复制定位物理路径。可以支持广域系统的数据复制定位。关键词:数据格网复制定位改进环型拓扑结构·陛能分析国防科学技术大学研究生院学位论文
,:珺瑂猻甒..,瓺猄篋
学位论文作者签名:垒。.:焦独创性声明学位论文版权使用授权书、学位论文题目:筮鲞整塑生煎蕉劐鏖焦珏窒日期:砂—乒年,,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表和撰写过的研究成果,:H闖本人完全了怨国防科学技术大学有关保留、,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、:数量整旦主煎复劐枣焦煎塞作者指导教师签名:日期:年月C苎宦畚脑诮饷芎笫视帽臼谌ㄊ椤
圈窨燮鲨第一章绪论§数据格网因特网协议分层结构计算格网仂议分层结构数据格网协议分层结构§.芯勘尘计算格网的研究已经相当成熟,不过不少研究最初仅仅是作为一种资源协同工作格网提出的,如。““’删和”,这些研究中并没有把数据作为一种特殊资源来对待。数据格网的研究始于对数据资源特殊性的认识:数据资源不同于其它计算、存储、仪器等资源,数据可以无限复制,同时源数据不受任何损失。项目后来考虑到数据资源的特殊性,又加入对数据管理的支持,并将它集成到格网的体系框架中,提出了数据格网的概念”’”。而至今没有明显的数据管理的接口。也有一些项目一开始就是针对分布式数据密集型科学并行计算提出的,如离子物理数据格网,格网物理网娲⒉檠,高性能存储系统等,这些项目对数据格网的研究提供了很多有益的探索“““数据格网是一种特殊的计算格网,现在主要的数据格网研究集中在数据密集型的科学并行计算。·“⋯川。现在,各数据格网研究机构,如欧洲数据格网⒗胱游锢硎据格网,格网物理网“”’”榷疾捎肎屑浼魑5层支持,并积极参与格网研究的合作。图复制定立服务在格网的体系结构中的位置国防科学技术大学研究生院学位论文第
因为不少研究都以项目中开发的回为基础,已经成为计算格网研究事实上的基础。项目研究定义了大量的协议,服务和A搜芯糠便,研究人员将这些协议和治层,这就是的闾逑到峁箍蚣堋!。”,以及数据格网的分层协议结构与格网憬峁刮实亩杂叵怠。文献汹岢隽艘恢指9阋宓氖莞裢枷耄航莸募煽醋魇莞裢枷氲挠用,称“以前的数据库、分布式数据库、分布式数据仓库都是不同程度格网性的体现”。我们认为数据格网的核心思想在于数据的集成和数据在格网范围内的有效共享。我们的研究正是基于对于数据格网这一本质属性的认识提出的。§.τ帽尘数据格网与传统的分布式数据库系统不同,它为数据的共享提供了极大的灵活性,允许异构的、已经存在的数据存储系统动态的加入到数据格网中,成为数据格网有机的一部分,同时保持自主性。对外提供简单的数据访问接口,兼容已有的数据应用系统和使用方式。所以数据格网具有很好的发展前景。下面,我们将列举一些已经出现的和正在出现的数据格网应用,这些都是传统的分布式数据库系统难以有效支持的,来说明数据格网研究的必要性和应用前景。数据密集型科学并行计算俊W钗4车氖莞裢芯磕谌菔俏A私饩鍪密集型的科学并行计算问题。在这些问题中,数据量庞大而复杂,对数据的存储和管理有相当高的要求,数据格网技术的研究势在必行。如,现代物理试验中某些仪器产生的数据以,甚至计,这些与日俱增数据的存储管理、共享使用成为试验中面临的一个难题。再如,生物数据非常复杂,包括物体本身、细胞、染色体、⒌ジ鱿赴难返雀鞲龇矫娴男畔ⅲ愦味嗲依嘈透丛樱笤谘究水稻的蛋白结构时,可能会用到基因数据库、