1 / 65
文档名称:

基于元数据的数据仓库任务调度原型系统的设计与实现.pdf

格式:pdf   页数:65
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于元数据的数据仓库任务调度原型系统的设计与实现.pdf

上传人:cherry 2014/2/24 文件大小:0 KB

下载得到文件列表

基于元数据的数据仓库任务调度原型系统的设计与实现.pdf

文档介绍

文档介绍:北京交通大学
硕士学位论文
基于元数据的数据仓库任务调度原型系统的设计与实现
姓名:牛筱峰
申请学位级别:硕士
专业:计算机软件与理论
指导教师:林友芳
20080601
中文摘要这些过程内部、过程之问存在着复杂的关系。如何设计一个较好的调度系统,使元数据及元数据管理的相关研究为解决数据仓库任务调度问题带来了新的思摘要:数据仓库系统建设可以分为四个过程:数据采集,,,数据展现。其在保证数据正确性的前提下尽可能的提高系统效率,是数据仓库调度系统所要解决的问题。路。橹岢龅墓ü膊挚庠DP珻峁了一个描述数据仓库领域数据源、数据目的、转换、分析以及数据仓库管理元数据的通用框架,为异构产品和工具之间进行元数据通信和共享提供了标准。近年来,工作流技术同益成熟,为实现业务流程管理和流程自动化,提高系统效率提供了切实可行的解决方案。基于以上背景,作者深入研究了铁路试点数据中心的建设过程,分析了铁路试点数据中心的实际环境、任务调度现状和存在的问题,据此提出了一种基于元数据的数据仓库任务调度系统的设计方案。该系统基于DP停缘鞫仍数据库为核心,将数据仓库调度过程集中起来,由一个调度系统来统一管理。为了提高系统的处理效率,作者将工作流技术引入到数据仓库任务调度过程,用来协调调度活动的执行。之后,作者描述了任务调度实现的流程,并讨论了系统实现中业务规则表示、并发控制、任务管理、任务指派、依赖检查、转发控制等关键问题。关键词:数据仓库;元数据;数据仓库调度;工作流;分类号:
,,.:瑃,,;北京交通大学硕士学位论文;,,...,;篢.
导师签名:埘衅筱山争签字同期:砷姆舌月多日学位论文版权使用授权书签字同期:砂月罗日本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得学位论文作者签名:
辟颀哞签字同期:独创性声明铝薘矽口本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:
致谢光阴似箭,转眼间岁月匆匆而过。两年来在学识渊博的老师们的谆谆教诲下,在实验室众多师兄、师姐帮助中,我学到了丰富的专业知识和不懈追求、努力探索的科研精神,这些宝贵财富使我受益终生。在此要特别感谢我的导师林友芳副教授,与林老师结识并有幸师从于他开启了我生命中的重要转折。在整个研究生学习期间,林老师严谨的治学态度和科学的工作方法潜移默化地影响着我,他勤奋、踏实的研究精神时时刻刻鞭策着我;林老师悉心指导我们完成一系列的科研工作,在学习上和生活上都给予我莫大的关心和帮助,在此真诚地对林老师表示深深的谢意在课题研究和相关项目进展期问,也得到黄厚宽教授的诸多指导和帮助,在此对黄老师表示衷心的感谢。在实验室工作及撰写论文期间,与同一课题研究组的杨再审、施洋同学开展了多次卓有成效的讨论,在此向他们表达我的感激之情。最后深深感谢艰辛中任劳任怨的父母,勤劳朴实的他们给了我无私的爱和无尽的支持,也给了我永远的激励去回报他们的殷殷期盼
,以保证数据仓库内的信息是关于整个企业的一致的全局信息。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。数据仓库一词尚没有一个统一的定义,⒓傻、,用于支持管理人员的决策⋯。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。根据数据仓库概念的含义,数据仓库拥有以下几个特点:嫦蛑魈操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。傻面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往