文档介绍:山 东 大 学 硕 士 学 位 论 文
摘 要
目前 国内的数据仓库应用已经比较普及
从电信
银行 证券
到汽车
税务等行业领域
山东网通是北方网通的龙头老大
作为国内电信行业的一个重
要组成部分
数据仓库建设还没有正式开始
本课题针对企业发展的需要
将数据仓库技术应用于山东网通的经营分析系
统的建设中
力求提供一套可行的解决方案
我们试图完成的这个数据仓库模型
可以分为 数据抽取 转换
清洗 和
转载 的过程
数据仓库
分析等几个部分
本文首先对企业的业务需求进行了探讨
然后对原始数据进行分析
由于关
系型数据库在数据分析层面己经不能适应企业业务发展的需要
因此我们可以通
过建立数据仓库
并结合 分析技术
从大量的数据中发现有利于企业发展
的知识信息
同时保证对业务数据的便捷访问
以更快更好的方式回答复杂的问
题
需求分析已经确定了用户业务分析所需要的数据
模型设计阶段将确定数据
仓库系统将来的蓝图
该阶段的主要任务是进行数据仓库的逻辑设计
包括选择
合适的主题
确定事实表
相关的维 属性
设计正确的表结构和主
外键关系
等
数据采集和数据处理是建设数据仓库不可或缺的步骤之一
在数据抽取 清
洗 转载过程中
数据质量问题凸现出来
对数据进行检验和整理
确保数据仓
库中数据的一致性
还要对部分数据进行聚集操作
提高数据仓库的查询 分析
速度 然后这些完整的
一致的
细节的和综合的数据才可以进入数据仓库 对
数据清洗转换进行了介绍
主要阐述了数据质量问题在数据仓库解决方案中
的重要地位
数据质量的分类
同时对本课题中的 的设计和实现进行了描
述
本论文还对项目采用的 分析工具 进行了介绍
并使用
进行了简单的 分析
然后对本课题进行过程中形成的一些
经验进行了总结
并展望了今后的工作方向
关键字 数据仓库
维度建模
泛
山 东 大 学 硕 士 学 位 论 文
︸歼
山 东 大 学 硕 士 学 位 论 文
咖
山 东 大 学 硕 士 学 位 论 文
第 章 绪论
, 课题背景及研究对象
本论文的研究对象是中国网通集团公司山东省分公司
随着山东网通在全省
范围内的各大业务系统的建立和实施
各地市公司逐步建立起了支撑业务发展和
分析的多套系统
这些系统的建立极大提高了通信公司的工作效率
但由于各业
务系统互相独立
业务数据存放在一个一个的业务数据库中
不能充分联系 造
成系统间的数据不能有效的共享
从而出现了业务系统“信息孤岛”情况
在通信市场竞争日趋激烈的情况下
通信公司迫切需要对各个业务系统的数
据进行统计分析
同时全省业务日趋统一
向省公司集中
省通信公司需要及时
地了解全省的业务发展情况
这样会存在两方面的问题 一方面
通信公司分析
决策的数据来源于多个分散的业务系统 另一方面
各个业务系统无法实现自身
数据在整个通信公司范围内的共享
山东网通为了解决这些问题
需要建立一个企业级的数据仓库
用于发布经
营分析数据
在这个平台上
系统的使用者可以从平台上获得相关的统计数据和
指标数据
同时 建立这样一个平台
可以有效的促进业务系统间数据处理的一
致性 提高各业务系统协同工作的能力
未来企业的竞争
在很大程度上是其收集数据
分析数据能力的竞争 这种
分析只有建立在企业内部各个环节和外部市场等方面的数据基础上
刁能真正的
体现企业运行的真实情况
也表现出用户的消费行为等特征
数据仓库技术是行
业竞争的必然结果
, 国内外研究现状
数据仓库作为一个新的研究领域
它的研究和应用得到了广泛的关注 也很
快成为数据库市场的一个新的增长点
国内外许多厂家和公司如
和微软等有实力的公司都在这个领域进行了深入的研究
并相继推出了自己的数
据仓库解决方案
在我国
数据仓库启动较晚
主要由于当时我国的应用基础尚不完善 企业
意识不足
但随着我国信息化建设的逐渐完善和应用意识的提高
许多行业 如
电信 金融
税务等逐步认识到数据仓库技术对企业宏观发展带来的巨大的经济
第 页共 页
山 东 大 学 硕 士 学 位 论 文
效益 纷纷建立起数据仓库系统
以等厂商也为我国提
供了大型数据仓库的解决方案
目前已经成功建设并收回投资的项目已经很多
据 的一份数据仓库市场占有率的报告显示
截止到 年 美
国的数据仓库销售额占