文档介绍:1、决策问题的类型〔按结构化程度分为〕:〔第一局部ppt17〕
a结构化决策问题。能够描述清楚的问题,三个阶段都能使用确定的算法或决策规那么。
b半结构化决策问题。不能够描述清楚,而只能凭直觉或经验作出判断的问题。三个阶段都不能使用确定使用数据和模型,处理结构化问题,与ES结合后,可处理半结构化问题
10、数据集市(Data Mart)——具有特定应用的数据仓库,主要针对某个具有战略意义的应用或者具体部门级的应用,支持用户利用已有的数据获得重要的竞争优势或者找到进入新市场的具体解决方案。〔第四局部ppt18〕
数据集市可以分为两种:
a独立的数据集市(Independent Data Mart),数据直接来源于数据源。
b附属的数据集市(Dependeant Data Mart),数据来源于中央的数据仓库。
数据集市的特点
〔1〕规模较小,灵活,
〔2〕开发工作一般由业务部门主持定义、设计、实施、管理和维护。
〔3〕能够快速实现,代价较低,投资回收期短,风险小。
〔4〕具集的紧密集成。
〔5〕有利于进一步升级到完整的数据仓库或形成分布式数据仓库。
数据集市的应用:人力资源数据集市、财务数据集市、
销售数据集市、市场数据集市等
数据仓库:是指从业务数据中创立信息数据库,并针对决策和分析进行优化,且支持决策过程的、面向主题的、集成的、随时间变化的、稳定的数据集合。〔第四局部ppt6〕
数据仓库的特点 〔第四局部ppt9〕
a面向主题 b集成的 c数据仓库是稳定的 d随时间变化的
数据挖掘:具体地说是在数据库中,对数据进行一定的处理,从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含的、事先未知的、但又是潜在有用的信息和知识的过程。〔第四局部下ppt14〕
数据仓库构建大致有如下几个步骤
1〕明确主题 2〕概念设计 3〕技术准备 4〕逻辑设计
物理设计 6〕数据仓库生成 7〕数据仓库的运行与维护
12、OLTP、OLAP〔第四章上ppt39〕
On-line Analytical Processing(在线分析处理或联机分析处理) 是针对特定问题的联机数据访问和分析,使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。(OLAP委员会的定义) 〔第四章上ppt44〕
OLAP的特性 1. 快速性 2. 可分析性 3. 多维性 .〔第四章上ppt46〕
OLTP系统——联机事务处理
On-Line Transaction Processing
事件驱动,面向应用。
如:银行的储蓄系统
OLAP系统——联机分析处理
On-Line Analytical Processing
跨部门,面向主题。
OLTP与OLAP比照
数据挖掘的主要方法〔第四局部下ppt16〕
〔1〕归纳学习方法 信息论方法〔决策树方法〕:
ID3、ID4、ID5、、IBLE方法