文档介绍:东北电力大学
硕士学位论文
基于Oracle 10g网格平台的数据分析系统设计与实现
姓名:祖悦
申请学位级别:硕士
专业:计算机应用技术
指导教师:党德玉
20080301
摘要现在:网格软件供应,安全及身份管理,应用程序管理及监控,工作负载管理,菇ㄍ衿教ǎǜ玫慕饩鍪萃袷件架构,实现方法和获得的性能,并于平台上开发了一个用于税务数据分析和分布式数据流频繁项的数据更新算法,根据分布式数据的需求和使用特性进行法应用到所开发的税务网格中,共同验证所构建的数据网格平台的高效数据处瘢皇萃瘢和窕肪诚碌氖莞蹦莳,由于互联网的高速发展,网格计算已经成为近年来国际上兴起的一种重要信息技术。其目的是把因特网上的资源组织在一个大框架下,为解决大型的科学计算,数据服务和网络信息服务提供一个方便用户使用的虚拟平台。数据网格是基于广域网对海量、分布异构的数据资源进行管理、访阅和共享的系统。目前,数据网格多数研究致力于制定网格环境下访问数据库的协议和中间件。但是往往忽略了数据网格对数据的处理能力。因此,砑究和构建一种专用于数掘处理的高效数据网格平台成为迫切需要。亲盼M窦扑闼7⒌幕〖芄谷砑K耐裼攀浦饕L系统管理等。因此,利用处理的低效问题。本文首先分析和比较了几种现有的数据网格平台,分析了用于构建网格平台的主要技术,然后介绍了诠菇ㄍ衿教ǚ轿鞯挠攀疲疚闹氐阊究和探讨如何根据应用来构建数据网格平台。文中详细阐述了根据实际应用利用组件构建一种全新网格平台的软挖掘的网格系统,用来验证数据网格对数据处理的能力。本文提出了~种基于有选择的数据更新,用以解决网格中数据的全部更新所带来的低效性,并把算理能力。关键词:
。瑃,.东誰瞧力大学磺貉宦畚琩甀琩—..瑃。.:瑂,,瑄琁,.’。,..—,。。,一“一,
,,,::..#曼曼拦.——
日期:麦夷辍辉履猜日期:逊炅⒃滤咳垫滥辍;ピ铝⑸塑署名单位仍然为东北电力大学。律意义上已属于他人的任何形式的研究成果,也不包含本人已用于其他学位申利。本人离校后发表或使用学位论文或与该论文直接相关的学术论文或成果时,论文原创性声明本人声明,所呈交的学位论文系在导师指导下本人独立完成的研究成果。文中依法引用他人的成果,均已做出明确标注或得到许可。论文内容未包含法请的论文或成果。本人如违反上述声明,愿意承搀以下责任和后果:交回学校授予的学位证书;学校可在相关媒体上对作者本人的行为进行通报;本人按照学校规定的方式,对因不当取得学位给学校造成的名誉损害,进行公⒌狼福本人负责因论文成果不实产生的法律纠纷。论文作者签名:日期:论文知识产权权属声明本人在导师指导下所完成的论文及相关的职务作品,知识产权归属东北电力大学。学校享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权导师签名:,、
第绪论课题研究的背景和意义近几十年来,科学技术的迅猛发展和信息化的推进,使褥人类社会所积累源,减少资料收集、数据采集等重复劳动和相应费用。但是,在实施数据共享的过程当中,由于不同用户提供的数据可能来自不同的途径,其数据内容、数据格式和数据质量千差万别,有时甚至会遇到数据格式不能转换或数据转换格交换信息和进行商务事务的实体,企业数据交换也从企业内部走向了企业之间;上的紧耦合关系,导致一旦应用发生变化或物理数据变动,整个体系将不得不随之修改。因此,我们进行数据集成将面临着如何适应现代社会发展的复杂需求、有效扩展应用领域、分离实现技术和应用需求、充分描述各种数据源格式以及发布和进行数据交换等问题。数据集成概念正是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从丽为企业提供全面的数据共享。在企业数据集成领域,已经有库等方法来构造集成的系统,这些技术在不同的着重点和应用上解决数据共享问题和为企业提供决策支持。联邦数据库系统由半自治数据库系统构成,相互之间分享数据,联盟各数据源之间相互提供访问接口,同时联盟数据库系统可以是集中数据库系统或分布式数据库系统。异构松耦合数据库往往不提供统一的接网,但可以通过统一的语言访问数据源,其中核心的是必须解决所有数据源语义上的问题。中间件模式通过统一的全局数据模型来访闷异构的数据库、遗留系统、的数据量已经超过了过去年的总和,数据的采集、存储、处理和传播的数量也与日俱增。企业实现数据共享,可以使更多的人更充分地使用已有数据资式后丢失信息等棘手问题,严重阻碍了数据在各部魅砑低持械牧鞫共享。因此,如何对数据进行有效的集成管理已成为增强企业商业竞争力的必然选择。由于现代企业的飞速发展和企业逐渐从~个孤立节点发展成为不断与网络同时,数据的不确定性和频繁变动,以及这些集成系统在实现技术和物理数据了很多成熟的框架可以利用。目前通常采用联邦式、基于中间件模型和数据仓簿滦
曼一协调各数据源系统,向上为