文档介绍:《数据仓库与数据挖掘》课程
课程编号:1101002340
DM 上机任务书
主撰人李向东
河北工业大学经济管理学院
2015 年 1 月
一、上机目的
本上机是《数据仓库与数据挖掘》课程的上机教学环节。配合《数据仓库与数据挖掘》的课程教学,通过上机增强学生对所学知识的感性认识,加深对所学知识的理解,使学生对数据仓库与数据挖掘的应用有所了解,提高学生分析和解决实际问题的能力。
二、上机要求
学生应在上机前根据老师布置的内容和要求认真准备上机操作的内容,包括认真阅读参考资料、熟悉上机主要内容、步骤和预期上机结果;应认真完成上机内容,出现问题及时和指导教师进行沟通;上机结束后应认真总结,巩固课堂学习内容,提高运用所学理论知识和方法的能力。
三、上机内容
上机课次
上机名称
主要内容
1
基础
Clementine用户界面、节点基本操作、数据流的基本管理和执行、示例、变量类型、数据读入、生成上机方案数据
2
变量管理
变量说明、变量值重新计算、变量类别值调整、生成新变量、变量离散化、生成样本集分割变量
3
样本管理
样本排序、样本条件筛选、样本随机抽样、样本浓缩处理、样本分类汇总、样本平衡处理、样本数据转置、数据重新组织、数据合并
4
数据基本分析
数据质量探索、基本描述分析、变量分布的探索、变量重要性分析
5
分类1
(药物研究;学生社会公益活动)
6
分类2;
BP神经网络分析(电信客户数据);
7
关联规则
Apriori分析(超市顾客信息);
8
聚类;
K-Means聚类分析(经济发展数据);
9
响应与自动建模
分类器响应建模;数字范围目标自动建模
10
综合应用
基于数据建模
四、考核与报告
在每次上机结束前,指导教师验收上机完成情况。上机结束,学生提交上机报告。根据上机报告和上机出勤情况综合评定上机成绩。
五、说明
上机地点:经济管理学院实验室