文档介绍:《数据仓库与数据挖掘》课程
课程编号:1101002340
DM 上机指导书
主撰人李向东
河北工业大学经济管理学院
2015 年 1 月
前言
上机总体目标
本上机是数据仓库与数据挖掘课程的上机教学环节。目的在于通过上机上机增强学生对所学知识的感性认识,加深对所学知识的理解,使学生对数据仓库和数据挖掘的应用有所了解,提高学生分析和解决问题的能力。
⒉适用专业年级
信息管理与信息系统专业学生
⒊先修课程
数据库原理与技术,统计学
⒋上机课时分配
上机项目
上机要求
上机类型
每组人数
上机
学时
上机一
必作
综合
1
2
上机二
必作
综合
1
2
上机三
必作
综合
1
2
上机四
必作
综合
1
2
上机五
必作
综合
1
2
上机六
必作
综合
1
2
上机七
必作
综合
1
2
上机八
必作
综合
1
2
上机九
必作
综合
1
2
上机十
必作
综合
1
2
⒌上机环境
Windows XP Pro系统。Clementine12,网络环境。
⒍上机总体要求
教师应在课程开始前协助上机室完成上机环境的准备工作;上机过程中应对学生出现的问题给予及时指导,帮助学生完成上机内容;上机结束后,对学生的上机情况进行及时整理分析,并提出相应建议,以提高后续上机质量。
学生应在上机课前根据老师布置的内容和要求认真准备本次上机操作的内容,包括认真阅读参考资料、熟悉上机主要内容、步骤和预期上机结果;应认真完成上机内容,出现问题及时和指导教师进行沟通;上机结束后应认真总结,巩固课堂学习内容,提高运用所学理论知识和方法的能力。
⒎本上机的重点、难点及教学方法建议
重点:Clementine用户界面、节点基本操作、数据流的基本管理和执行、示例、变量类型、数据读入、生成上机方案数据; 变量说明、变量值重新计算、变量类别值调整、生成新变量、变量离散化、生成样本集分割变量; 样本排序、样本条件筛选、样本随机抽样、样本浓缩处理、样本分类汇总、样本平衡处理、样本数据转置、数据重新组织、数据合并; 数据质量探索、基本描述分析、变量分布的探索、变量重要性分析
难点:节点参数设置和节点算法的理解。
教学方法:上机由学生以自主方式开展,使用计算机辅助完成。指导教师在上机过程中对上机情况进行具体指导。
目录
上机一
Clementine基础
上机二
Clementine变量管理
上机三
Clementine样本管理
上机四
Clementine数据基本分析
上机五
Clementine分类1
上机六
Clementine分类2;
上机七
Clementine关联规则
上机八
Clementine聚类;
上机九
响应与自动建模
上机十
综合应用
实验 1
一、上机目的
通过本上机的学习,使学生了解Clementine用户界面,掌握节点基本操作、数据流的基本管理和执行、变量类型、数据读入、生成上机方案数据方法,为今后数据挖掘的学习和应用奠定基础。
二、上机内容
Clementine用户界面、节点基本操作、数据流的基本管理和执行、示例、变量类型、数据读入、生成上机方案数据。
三、上机要求
采用以学生自主训练为主的开放模式组织教学。
四、上机原理、方法和手段
利用Clementine12。
五、上机条件
Windows XP Pro系统,Clementine12,网络环境。
六、上机步骤
(基础).pdf。
七、上机报告
内容主要包括上机预录和上机报告三部分。
预习报告:上机目的、要求,简要的上机步骤,形成一个操作提纲。
记录上机中所做的每一步操作。
对上机数据、上机中的特殊现象、上机操作的成败、上机的关键点等内容进行整理、解释、分析总结,回答思考题,提出自己的看法。
八、注意事项及其它说明
遵守上机室的相关规定
实验 2
一、上机目的
通过本上机的学录选项节点操作,掌握变量说明、变量值重新计算、变量类别值调整、生成新变量、变量离散化、生成样本集分割变量等技能,为今后数据挖掘技术的学习和应用奠定基础。
二、上机内容
变量说明、变量值重新计算、变量类别值调整、生成新变量、变量离散化、生成样本集分割变量。
三、上机要求
采用以学生自主训练为主的开放模式组织教学。
四、上机原理、方法和手段
利用Clementi