1 / 7
文档名称:

数据挖掘及决策树.doc

格式:doc   大小:958KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘及决策树.doc

上传人:mkjafow 2019/9/16 文件大小:958 KB

下载得到文件列表

数据挖掘及决策树.doc

文档介绍

文档介绍:昆明理工大学信息工程与自动化学院学生实验报告(2016—2017学年第学期)课程名称:数据仓库与数据挖掘开课实验室:信自楼4442017年06月01日年级、专业、班软件141班学号XX姓名陈*成绩实验项目名称数据挖掘及决策树指导教师贾连印教师评语该同学是否了解实验原理: □ □ □该同学的实验能力: □ □ □该同学的实验是否达到要求: □ □ □实验报告是否规范: □ □ □实验过程是否详细记录: □ □ □教师签名:年月日一、上机目的及内容目的:;、,掌握数据挖掘相关工具的使用。内容:给定AdventureWorksDW数据仓库,构建“Microsoft决策树”模型,分析客户群中购买自行车的模式。要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的二、实验原理及基本技术路线图(方框原理图或程序流程图)请描述数据挖掘及决策树的相关基本概念、模型等。数据挖掘:从大量的、不完全的、有噪音的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又潜在有用的信息和知识的过程。数据挖掘的功能:功能概念或作用概念描述对某类对象的内涵进行描述,并概括这类对象的有关特征关联分析从大量的数据中发现项集之间有趣的联系、相关关系或因果结构,以及项集的频繁模式分类与预测分类:提出一个分类函数或者分类模型,该模型能把数据库中的数据项映射到给定类别中的一个;预测:利用历史数据建立模型,再运用最新数据作为输入值,获得未来变化趋势或者评估给定样本可能具有的属性值或值的范围聚类分析根据数据的不同特征,将其划分为不同数据类偏差分析对差异和极端特例的描述,揭示事物偏离常规的异常现象,其基本思想是寻找观测结果与参照值之间有意义的差别决策树:是一种预测模型,它代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。常用决策树算法:算法概念ID3在实体世界中,每个实体用多个特征来描述。:用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;在树构造过程中进行剪枝;能够完成对连续属性的离散化处理;能够对不完整数据进行处理。三、所用仪器、材料(设备名称、型号、规格等或使用软件