文档介绍:北京交通大学
硕士学位论文
数据仓库元数据集成与转换工具的设计与实现
姓名:施洋
申请学位级别:硕士
专业:计算机应用技术
指导教师:林友芳
20080601
中文摘要元数据是数据仓库的灵魂。它不仅提供了数据仓库中的数据结构,也提供了数据仓库的构建和使用规则。为了使数据仓库中各个软件能够无缝地合作,必须在元数据层进行有效的集成。所以,本文着重研究了元数据集成与转换的策略和技术实现,从而完成元数据的汇集与共享。计了一个基于联邦式的元数据集成与转换工具,最后在技术上对该工具加以实现。教至耸莶挚庵性J莸囊庖濉⒎冻牒凸芾碓颉谏杓撇糠郑ü致墼J菁刹呗院痛娲⒛J剑杓屏艘桓龌联邦式的元数据集成与转换工具的架构,并提出了一种元数据汇集方谑迪植糠郑紫忍教至嗽J葑;还ぞ叩淖饔煤图际跏迪郑缓筇据双向迁移方案。关键词:数据仓库;元数据;联邦式架构;集成:转换分类号:本文首先探讨了元数据集成的架构和元数据的存储模式,然后在此基础上设本文的研究成果如下:案,用于解决局部元数据仓储向全局元数据仓储集成问题。出了一种基于关系型数据库存储的模型集成的方法和策略并加以实现,最后提出一种用来同步局部元数据仓储和全局元数据仓储的元数本文提出的元数据集成和转换工具,在策略和技术上实现了联邦式的元数据管理架构,在元数据的汇集、共享和有效管理方面的做出了有意义的探索。
.:;;,,琣,籑籇瑃,,甀琤甀瑄畐篢.
舀‰恽签字同期:轎譬年衫月签字日期:力谚年乡月力同学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,C艿难宦畚脑诮饷芎笫视帽臼谌ㄋ得并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。学位论文作者签名:导师签名:
学位论文作者躲参坪签字吼阅辍录独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。
致谢光阴似箭,转眼间岁月匆匆而过。两年来在学识渊博的老师们的谆谆教诲下,在实验室众多师兄、师姐帮助中,我学到了丰富的专业知识和不懈追求、努力探索的科研精神,这些宝贵财富使我受益终生。在此要特别感谢我的导师林友芳副教授,与林老师结识并有幸师从于他开启了我生命中的重要转折。在整个研究生学习期间,林老师严谨的治学态度和科学的工作方法潜移默化地影响着我,他勤奋、踏实的研究精神时时刻刻鞭策着我;林心和帮助,在此真诚地对林老师表示深深的谢意在课题研究和相关项目进展期间,也得到黄厚宽教授的诸多指导和帮助,在此在实验室工作及撰写论文期间,与同一课题研究组的杨在申、牛筱峰同学丌展最后深深感谢艰辛中任劳任怨的父母,勤劳朴实的他们给了我无私的爱和无尽的支持,也给了我永远的激励去回报他们的殷殷期盼老师悉心指导我们完成一系列的科研工作,在学习上和生活上都给予我莫大的关对黄老师表示衷心的感谢。了多次卓有成效的讨论,在此向他们表达我的感激之情。
课题背景和意义髀数据仓库简介随着全球化进程的逐步深化,企业内部与外部的联系日渐紧密,甚至融为一体,这种变化也深刻影响着企业的组织结构。企业必须使自身的业务精简化、自动化,以求内部与外部业务系统应用的无缝连接。然而多年“自发降男畔⒒建设,企业信息内部缺乏“自觉”的信息系统总战略规划,致使局部需求得到满一种能够轻松访问特定商业实体信息的能力,通过建立底层结构,来联系横贯整个企业的异构系统、应用、数据源等,完成在企业内部系统之间无缝地共享和交数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。在企业数据集成领域中,已经有了成熟的框架可以利用。但在实施数据共享的过程当中,由于数据源的异构性、分布性、式不能转换或转换格式后丢失信息等棘手问题,严重阻碍了数据在各部门和各软件系统中的流动与共享。因此,如何对数据进行有效的集成管理是构建数据集成字信息组织和处理的基本工具,是理解数据含义和如何使用数据的关键。所以,每一个软件产品和工具能够在数据层进行有效集成的前提是,它在元数据层就必为了更加明确数据仓库中元数据的来源和作用,我们首先要对数据仓库的架构以及数据在数据仓库中的流动和使用有比较直观的了解。莶挚獾奶氐数据仓库是一个面向主题的、集成的、相对稳定的、随时间变化的用来支持管理人员决策的数据集合不同于操作型系统围绕业务组织数据且各操作型系统彼此分离的特点,数据足的同时,无法实现