1 / 21
文档名称:

《商务智能教学课件》商务智能21页版.pdf

格式:pdf   大小:449KB   页数:21页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

《商务智能教学课件》商务智能21页版.pdf

上传人:Q+1243595614 2018/4/18 文件大小:449 KB

下载得到文件列表

《商务智能教学课件》商务智能21页版.pdf

相关文档

文档介绍

文档介绍:商务智能 
构造数据仓库 
明确需求 
用户的主观分析需求 
选择工具 
数据抽取(data extract)工具 
数据清洗(data cleaning)工具 
元数据(metadata)管理工具 
数据分析工具  ( look for patterns ) 
数据挖掘工具  ( look for hidden patterns ) 
数据展现工具 
构建数据仓库 
 
操作型处理 
也叫事务处理,是指对数据库的日常联机访问操作,通常是对一个或一组记录的查询和修改,主要是为企业特定的应用服务
的,所以也叫联机事务处理。 
 On‐Line Transaction Processing(OLTP) 
通常仅仅是对一个或一组记录的查询或修改; 
查询简单,但执行频率高; 
人们关心的是处理的响应时间、数据的安全性和完整性等指标。 
 
分析型处理 
也叫做信息型处理,主要用于企业管理人员的决策分析,为制订企业的未来经营管理计划提供辅助决策信息。  
需要对大量的事务型数据进行统计、归纳和分析; 
需要访问大量的历史数据; 
执行频率和对响应时间的要求都不高。 
‐典型的的分析型处理 
决策支持系统  ( DSS ‐‐Decision Support System )  
 
事务处理环境不适宜 DSS 应用的原因 
在传统的以数据库为核心的事务处理环境中不适宜建立 DSS 等分析型应用,其原因主要有以下六条:  
事务处理和分析处理的性能特性不同: 
用户每次操作处理的时间短,存取数据量小,但操作频率高,并发程度大。 
每次分析可能需要连续运行很长的时间,存取数据量大,但很少做这样的分析处理,也没有并发执行的要求。 
数据集成问题: 
事务处理一般只需要与本部门业务有关的当前细节数据 
分析处理的数据可能来自多种不同的数据源 
对于需要集成数据的 DSS 应用来说,在应用程序中对事务处理环境中的这些纷繁复杂的数据进行集成,将带来下述问题: 
大大加重程序员的负担 
重复计算 
极低的分析处理效率 
数据的动态集成问题: 
集成数据必须以一定的周期进行刷新(即采用动态集成策略),但传统的事务处理环境并不具备动态集成的能力。 
历史数据问题 
事务处理一般只需要当前数据 
分析处理更看重历史数据 
数据的综合问题 
事务处理需要的是当前的细节性操作数据,而分析处理需要的往往是大量的总结性分析型数据,而非数据库中的细节
性操作型数据。
在分析前往往需要对细节数据进行不同程度的综合,传统的事务处理系统不具备这种综合能力 
数据的访问问题 
事务处理对于需要修改的数据必须实时‘更新’数据库   
分析处理不需要实时的‘更新’操作,但需要定时‘刷新’  
 
操作型数据和分析型数据 
特  性  操  作  型  数  据(DB)  分  析  型  数  据(DW) 
定位  面向应用的事务处理  面向主题的数据分析 
DB 设计  E‐R 模型  星型/雪花模型,数据立方体 
数据  当前的、最新的  历史的,具有时间跨度 
汇总  原始的,细节的  集成的,一致的 
视图  详细的,关系的  总体的,多维的 
操作类型  读/写(可变的)  读(稳定的) 
存取请求  可预知的  事先未知的 
访问记录  一次操作少量记录  一次操作大量记录 
DB 规模  100MB ~ GB  TB 
工作单位  短的,简单事务  复杂查询 
性能要求  对性能要求高  对性能要求较宽松 
 
数据仓库定义 
数据仓库就是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,用于支持经营管理过程中的决策制定。  
 
数据仓库的四个特征: 
面向主题 
主题是较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑意义上,是对应企业中某一宏观分析领域涉及
的分析对象。  
面向主题是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息。  
如果按照面向主题的方式进行数据组织,首先应该抽取主题,即按照管理人员的分析要求来确定主题,而与每个主题相关的数据又与
有关的事务处理所需的数据不尽相同。在该例中,我们可以抽取出三个不同的主题(即分析对象)及其相关的数据: 
 
集成 
数据仓库中的数据是为分析服务的,而分析需要多种广泛的不同数据源以便进行比较、鉴别,因此数据仓库中的数据必须从多个数据
源中获取,这些数据源