1 / 69
文档名称:

基于Web技术的数据仓库研究与设计硕士论文.pdf

格式:pdf   页数:69页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于Web技术的数据仓库研究与设计硕士论文.pdf

上传人:2024678321 2014/7/10 文件大小:0 KB

下载得到文件列表

基于Web技术的数据仓库研究与设计硕士论文.pdf

文档介绍

文档介绍:武汉理工大学硕士学位论文
摘要
随着数据仓库和技术的迅猛发展,人们对数据仓库和技术的研究越
来越广泛,数据仓库系统设计得是否合理,将直接关系到整个数据仓库系统的成
败。在分析技术与数据仓库体系结构的基础上,将挖掘技术引入
到数据仓库中,构建了一种基于方式的分布式数据仓库体系结构。
基于的分布式数据仓库系统的创建是一项既具有挑战性又有益的工作,
与传统的数据仓库相比,具有界面友好、使用方便的优点,并且还可将企业分布在
各地甚至全球的子公司、客户及企业外的数据库资源合理的引入到数据仓库中,
为企业提供更有力的决策支持,大大提高企业的经济效益。
本文在对数据仓库和技术相结合研究的基础上,重点从应用角度设计和
开发基于方式的数据仓库中的关键问题。在此基础上提出了一种基于
方式的分布式数据仓库体系结构。本文构建的基于的分布式数据仓库体系
结构可大大减少数据传输过程中网络流量,合理实现异构数据源的数据集成,为
数据仓库的开发起到一定的抛砖引玉的作用。文中详细分析了数据的特点,
以及挖掘技术,并且将数学方法应用于数据挖掘,建立了一种模型,改
进了一种数据挖掘算法,提出了一种混合策略,并实现了部分算法。
本文是按以下顺序组织的第部分简要介绍了数据仓库技术。第部分
说明了基于方式的数据仓库系统的组成并讨论了该数据仓库特点和实现方
式。本文的第部分与第部分讨论了数据仓库系统的设计和系统实现过程中
的关键技术,这是本文的重点。最后一章是对本文的总结并提出了对基于
方式的数据仓库需要进一步讨论的问题。
关键词数据仓库,数据挖掘,分布式,挖掘
武汉理工大学硕士学位论文




























武汉理工大学硕士学位论文
第章绪论
随着的迅猛发展,以及数据库技术与数据库管理系统的广泛应用,
人们需要处理的数据日益增多,更重要的是在激增的数据背后隐藏着许多可以
利用的重要信息,人们希望能够对其进行更高层次的分析与利用,因此如何更
好地管理和利用这些数据信息已经成为当前人们迫切需要并巫待解决的问题。
而目前的数据库系统虽然可以实现数据的录入、查询、统计等功能,但由于它
是一种单一的数据组织方式的数据库系统,不能解决异构类型的数据处理的多
样化要求并且,这种单一系统无法发现数据中隐藏的关系和规则,更不能根
据现有的数据预测未来的发展趋势。因此,导致了“数据爆炸但知识贫乏”的
现象。对于一个企业来说,构建一个用于商业活动的数据仓库决策支持系统,
可以极大地改善企业的经营效率,从而扩大市场,提高企业在市场竞争中的潜力。
研究现状
随着信息化进程在我国的不断推进,“数据库”对大多数企业来说已经是个
耳熟能详的词了,而且数据库技术的信息系统己经不断融入到了企业的各个部
门。但是在企业信息化的过程中,一方面,由于企业各个子系统的开发厂商、
开发平台的不同,造成各个子系统间相对独立,形成一个个信息孤岛另一方
面,企业拥有的数据随着时间的积累也在不断膨胀。在这个”数据就意味着财富”
的信息时代,,如何合理、高效地利用这些数据进行分析与决策,使其转化为真
正的财富,是现代企业提高竞争力的一个有效手段。
数据仓库概念是年首次根据传统的结合
技术提出的,以一书为标志,。
作为一个新兴领域,数据仓库发展很快,目前许多大学、公司,特别是数
据库厂家和决策信息服务公司根据自己的需要己经开发出了许多的数据仓库解
决方案。数据仓库技术的应用也己十分广泛,尤其在金融、保险、通讯、销售
等领域和政府部门大都采用数据仓库加上联机分析处理做市场分析和
决策分析。许多国内外大型企业和公司迫于市场竞争的巨大压力纷纷采用数据
仓库技术进行数据采掘和信息分析,取得了很好的经济效益和社会效益。
的研究报告表明,在其调查的家企业中,以上的企业计划在今
后两三年内采用数据仓库和数据采掘技术,大约己投资于数据仓库的公司
武汉理工大学硕士学位论文
都认为获得了巨大成功。但是数据仓库技术目前在应用上还不是很普及,面对
那些海量的历史数据我们如何分析、利用,从中抽取出对我们有价值的数据,
为我们的决策提供帮助。另一方面把数据仓库技术与技术相结合,将其从
单一方式推向方式,但是我们没有可以参考的系统与成熟的理
论。这些都表明其在理论和实践方面尚有许多问题需要更深入的研究与解决。
研究内容
数据仓库就是从不同的源数据中抽取数据,将其整理转换成新的存储格式,
为决策目的将数据聚合在一种特殊的格式中,这种支持管理决策过程的、面向主