文档介绍:北京工业大学
硕士学位论文
企业数据仓库建设中ETL方案设计与实现
姓名:李楠
申请学位级别:硕士
专业:计算机应用技术
指导教师:周小兵
20070401
摘要企业信息系统在运行的过程中会产生大量的数据和信息,如何分析和处理这些数据以获得对企业有用的决策信息越来越成为系统开发人员关心的问题。数据仓库所要研究和解决的问题就是如何从数据库中获取信息。因此,如何为企业构建一个先进、完善的数据仓库系统,从而提升核心竞争力已经成为企业发展的本文结合北京朝批商贸有限公司数据仓库项目的实例,从应用角度分析并解决了企业数据仓库从需求分析、建模到实施的关键技术。同时阐述了如何设计并取、转换和装载ぞ呃赐瓿墒莶挚獾氖菰隽孔霸厝挝瘛数据仓库是由企业的业务和管理驱动的,用户对业务和管理的需求是促进数据仓库系统建设的关键因素。通过对业务需求的深入调查,本文全面准确的总结了朝批企业数据仓库建设的需求,即要满足各级员工对企业的财务、推销、销售、库存、外欠等大量运营指标的多角度的分析需求。合理而完备的数据模型是用户业务需求的体现,是数据仓库成败的核心技术因素。本文论述了数据仓库的建模鞘迪质莶挚獾墓丶方凇R允迪质莶挚獾腅过程为出发点,本文设计并实现了一个通用的ぞ撸胖芈凼隽似涮逑趾晏婊凰枷氲腟据转换逻辑和聚集计算逻辑的设计。朝批数据仓库实旌近一年,取得了令人满意的应用效果。ぞ叩8毫嗣关键词数据仓库:晃冉#恍切湍P当务之急。实现一个灵活且具有较强通用性,数据提方法,重点阐述了如何采用实视图与虚视图结合的方式设计事实表,达到查询效率与系统性能的兼顾;同时提出了通过建立对照表和编码表的关联,来实现数据在不同维层次和维路径上的汇总查询。参数传递机制和具有创造性的能自动实现数据的增量更新的数据处理机制。最后,本文针对凳┗方冢直鹫攵允莸某槿。;缓妥霸匚侍猓出了一套行之有效的实施策略,重点分析了如何运用上述的ぞ撸惺天自动增量装载数据仓库数据的任务,运行良好。企业数据仓库的建立为企业各级人员提供了全面准确的分析数据,在企业的业绩分析、员工的绩效考核和物流成本核算方面已经发挥了不可替代的作用。
襬,.;.,,甌瓵,’’;..’
虢披导师虢煺吼团目期::&:关于论文使用授权的说明独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。签名本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅:学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。C艿穆畚脑诮饷芎笥ψ袷卮斯娑
第滦髀数据仓库技术的产生,商务智能泛头穸云渥钪匾5淖什!P畔ⅰ!=得到。在激烈的市场竞争环境下,这种基于业务数据的决策分析——联机随着全球经济步入信息分析的时代,信息对于企业的生存和发展发挥着越来越重要的作用,企业及政府机构都希望通过行处理,定量的理解企业的行为,获得能为企业决策提供科学依据的数据知识,从而获得竞争优势,为企业直接和间接的获得利益。近两年,在中国的企业应用中,正在迅速成为最热门的话题之一,因为越来越多的人坚信,将成为企业盈利的关键因素之一。由数据仓库蚴菁、查询报表、数据分析、数据挖掘、,数据仓库被作为企业数据集成平台为企业提供单一真实的数据视图,主要负责对各项企业各类信息的整合工作,包括了数据的迁移。数据的组织和存储,数据的管理与维护,为其他技术的应用提供坚实的数据基础。决策分析用户通过数据终端方便、有效地访问数据仓库并获取数据,用以评价企业过去、现在的经营和财务状况,预测市场未来发展趋势。利用数据仓库实现企业数据集成是企业实施商务智能最为重要、也是必须首先实施的步骤。,整个年代直到年代初,联机事务处理一直是数据库应用的主流。然而,应用在不断地进步。当联机事务处理系统应用到一定阶段后,用户便发现单靠拥有联机事务处理已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个市场相关行业的情况进行分析,而做出有利的决策。这种决策需要对大量的业务数据包括历史业务数据进行分析才能分析处理,比以往任何时候都显得更为重要。如果说传统联机事务处理强调的是更新数据库一向数据库中添加信息,那么联机分析处理就是从数据库中获取信息、利用信息。因此,著名的数据仓库专家“我们花了二十多年的时间将数据放入数据库,如今是该将它们拿出来的时候了。”】事实上,在将大量的业务数据应