文档介绍:北京工业大学
硕士学位论文
中小企业异构数据整合及数据转换模块的设计与实现
姓名:吴小炎
申请学位级别:硕士
专业:软件工程
指导教师:于学军;高维
20090501
摘要根据国家财政部的统计数字,目前中国%以上的中小企业已实现财务电算化,企业数据积累已达一定规模,即不是数据不够,而是数据太多了,海量的数据以各种存储方式散布在企业内部各个系统里面。而中国大多数中小企业,具有等特征,这使得企业数据的有效利用率则不足ァS谑牵谡飧鲂畔⒒贝全球经济竞争的新环境下,企业领导如果要做出一项决策,往往需要查询多个基于各种异构数据源的业务系统,再进行大量数据分析,其工作量大,且容易出现人为差错,从而影响决策的质量。那么中小企业怎样才能建立一个数据共享平台,以便提供统一的企业数据访问接口跹拍艽砗闷笠等哂嗟摹⒉还娣兜摹⑷因此,本文就中小企业存在的信息孤岛、数据碎片等问题提出了面向中小企⑶蚁晗该枋隽烁媒饩龇桨钢械氖据转换和查询分析四个部分组成。的宗旨是将企业现有数据源,包括各个一并抽取到数据中心中,然后通过数据转换模块允葜行闹胁还娣兜氖进行相关的数据转换操作,最后将规格化好的高质量数据提交给企业数据查询分中小企业使用异构数据整合解决方案并且结合数据转换模块以有效的解决散落于不同信息系统中的数据碎片,企业就可以将这些多源信息整合到一起,获得关于数据的整合视图,从企业信息资产中获得最大的商业价值。关键词异构数据;数据整合;数据中心;;连续变化的业务需求、信息孤岛、复杂的数据连接、不一致和残缺低质量的数据失的数据,以便提供给决策者查询分析呢业的基于数据中心的异构数据整合解决方案据转换模块墒莩槿⑹葜行摹⑹业务信息系统中的数据库表,以及文本,珽等还未形成系统的电子数据析平台进行分析,得到分析结果以供企业领导和决策者做出正确的商业决定。
北京工业人学工程硕士学位论文,%疭—甌瑆,..琲琧瑃——!痯瑆ィ甌琲琤—,琭琣瑃—.猻琺琲甪瑃,瓾
,,.琣,珽猻—,.,猻,;篋::,.阳
签名:墨域日期:』丝怔独创性声明关于论文使用授权的说明日期:趁垒骸本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部已在论文中作了明确的说明并表示了谢意。分内容,可以采用影印、缩印或其他复制手段保存论文。
第滦髀课题的背景业务增长迫使公司必须提高其自身的能力,以满足变化的业务需求。引入一些新的应用程序以支持这种新型的需求。以新的方式对现有的信息进行处理和分析,以便更好地把握关键性的业务挑战。有些公司并购了其他的公司,进一步地加速了它们在新的领域中的增长。遗憾的是,信息数据方面却不能始终以一种受到严格控制和有组织的方式发展,以支持这种增长。因此出现了冗余和不一致的信息孤岛【。为了能够在特定的领域中实现最高的效率,对于相同的数据,许多公司正采用面向服务的体系结构创砀髦指餮奈侍猓减少系统集成的成本、优化现有信息的重用和功能。采用和实现墓丶骤之一是标识最关键的业务功能及其设计。常见的做法是,重点关注那数公司不会只将客户信息存储在某一个地方。如果不清楚应该从何处获取相应的信息,以及哪个系统中保存着最新的并且最精确的信息,那么这就会成为一个很大的问题。如果不清楚这些问题的答案,就不可能实现返回一致的用户相关信息首先从各种数据源收集相关的信息。然后对数据进行处理,以消除冲突并创建表中国已经飞速地迈入信息时代,各行各业都建起了各自的网站以及各种各样的信息管理系统,诸如客户管理、库存管理、人力资源管理等等。然而不幸的是我们的网站和管理系统之间、本机构的各个管理系统之间以及各个机构的管理系统之间,绝大多数都是相互独立的,因此提供一个统一的信息数据分析入口和搭不同的应用程序以不同的方式进行表示。些由企业之间和企业外部的许多使用者使用的服务。这种服务最有可能需要来自许多不同系统中的数据,而这些系统包含着各自所需的那部分信息。例如,大多的服务。本文描述了使用数据整合模式作为集成来自不同数据源的信息的一种方式。示目标模型的公共结构。最后,将经过转换的信息应用于目标数据存储。
建一个数据信息共享平台迫在眉睫。在信息化的今天,信息时代的最大特征题。为了使得企业能够在现有的信息资产中获得最大的商业价值却并非易事,需解决以下几个问题:畔⒐碌海菀旃我国信息化经过多年的发展,企业已开发了众多计算机信息系统和数据库系统,并积累了大量的基础