文档介绍:潘怡编著
《数据仓库与数据挖掘》
课程实验指导书
长沙学院计算机科学与技术系
2009年9月
前言
本书是《数据仓库与数据挖掘》课程及《数据分析与挖掘》的实验指导书。全书分为三个部分,第一部分为实验内容对每个实验的实验目的、实验类型、实验学时、实验原理及知识点、实验环境(硬件环境、软件环境)和实验内容及步骤进行简单介绍,第二部分为实验指导对每个实验的实验方法,实验步骤及补充的实验知识进行详细介绍,第三部分为实验报告。
本实践课程主要介绍数据仓库的工作机理及其构建过程,。要求学生熟练使用数据库管理系统MS SQL Server,掌握典型的数据仓库系统及其开发工具的使用,理解数据挖掘的工作原理与流程,掌握典型数据挖掘技术及其工具的使用方法,熟悉SQL SERVER BI DEV集成挖掘环境。
要求学生实验前认真准备,实验后提供实验报告,给出详细设计方法以及设计依据。
实验报告的格式应采用统一封面,统一的实验报告纸。封面应包括:课程名称、实验序号、名称、专业、班级、姓名、同组实验者、实验时间。实验报告内容应包括:实验名称、目的、内容、实验步骤、实验记录、数据处理(或原理论证、或实验现象描述、或结构说明等)。
目录
第一部分实验内容
实验1:实践SQL Server数据多维分析环境
实验2:实践关联规则挖掘方法
实验3:实践决策树挖掘方法
实验4:实践聚类挖掘方法
实验5:实践神经网络挖掘方法
第二部分实验指导
实验1:实践SQL Server数据多维分析环境
实验2:实践关联规则挖掘方法
实验3:实践决策树挖掘方法
实验4:实践聚类挖掘方法
实验5:实践神经网络挖掘方法
第三部分实验报告
第一部分
实验内容
实验1:实践SQL Server数据多维分析环境
学习和掌握Sql Server 2005 Analysis Services 工具集,包括如何在 BI Development Studio 的 Analysis Services 项目中定义数据源、数据源视图、维度、属性、层次结构和多维数据集,如何查看多维数据集和维度,理解并掌握OLAP分析的基本过程与方法。
4学时
Server 服务
;
;
。
:
PC及其联网环境;
:
操作系统Windows, SQL Server 2005, SQL Server 2005 BI DEV STUDIO 。
I. 建立Sql Server 2005 数据挖掘实验环境
启动SQL Server 服务,打开BI开发环境
注册服务器
建立系统数据源连接
建立数据库和数据源视图
浏览多维数据集数据
编辑多维数据集数据
II. 实践多维数据集分析
假设一连锁超市的用户需求如下,从无到有设计一个数据仓库的基本架构,要求能够满足以下查询:
查询公司在2005年的总销售金额
查询公司在2005年第一季度的销售金额
查询公司在2005年上半年的销售金额
查询某供应商s1于2005年提供产品p1的金额总量
查询某供应商s1于2005年提供某产品p1的金额总量
查询某门市店d1于2005年共销售某一种商品p1的总金额
查询公司在2005年度共销售多少金额类别为c1的商品p1的总金额
根据要求:
建事实表和维度表
设计星型架构模型
分析元数据结构。
Sever 2005 BI DEV STUDIO?它包含几个主要部分?
?
?
?
?
?
?
实验2:实践关联规则挖掘方法
学习和掌握使用Sql Server 2005进行关联规则数据挖掘,了解并掌握挖掘结构、挖掘模型的基本概念,能够使用数据挖掘向导创建数据挖掘结构和模型,掌握数据挖掘设计器的使用方法,掌握模型查看器方法,能够使用挖掘准确性图表,了解模型的提升图,能够创建数据挖掘报告。
4学时
Server 挖掘结构
Server 挖掘模型
:
PC及其联网环境;