1 / 12
文档名称:

豆丁.ppt

格式:ppt   大小:156KB   页数:12页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

豆丁.ppt

上传人:xinsheng2008 2016/9/29 文件大小:156 KB

下载得到文件列表

豆丁.ppt

文档介绍

文档介绍:2016-9-292016-9-2911数据挖掘能做些什么数据挖掘能做些什么2016-9-292016-9-2922主要内容主要内容??概念描述概念描述??关联规则关联规则??分类与预测分类与预测??聚类聚类??分析方法分析方法2016-9-292016-9-2933概念描述概念描述??概念描述(概念描述(concept descriptionconcept description))––概念:对一个包含大量数据的数据集合总体情概念:对一个包含大量数据的数据集合总体情况的概述。况的概述。––概念描述概念描述(concept description)(concept description):对含有大量数据:对含有大量数据的数据集合进行概述性的总结并获得简明、准的数据集合进行概述性的总结并获得简明、准确的描述。确的描述。2016-9-292016-9-2944关联规则关联规则??关联规则(关联规则(Association RuleAssociation Rule))––关联规则挖掘就是发现大量数据中项集之间有趣的关联关联规则挖掘就是发现大量数据中项集之间有趣的关联––关联规则挖掘的典型案例:购物篮问题关联规则挖掘的典型案例:购物篮问题??在商场中拥有大量的商品(项目),如:牛奶、面包在商场中拥有大量的商品(项目),如:牛奶、面包等,客户将所购买的商品放入到自己的购物篮中。等,客户将所购买的商品放入到自己的购物篮中。??通过发现顾客放入购物篮中的不同商品之间的联系,通过发现顾客放入购物篮中的不同商品之间的联系,分析顾客的购买****惯。分析顾客的购买****惯。??哪些物品经常被顾客购买?哪些物品经常被顾客购买???同一次购买中,哪些商品经常会被一起购买?同一次购买中,哪些商品经常会被一起购买???一般用户的购买过程中是否存在一定的购买时间序一般用户的购买过程中是否存在一定的购买时间序列?列?2016-9-292016-9-2955关联规则关联规则––基本表示形式:基本表示形式:前提条件前提条件??结论结论[[支持度支持度, , 置信度置信度] ] buys(xbuys(x, , ““diapersdiapers””) ) ??buys(xbuys(x, , ““beersbeers””) [%, ) [%, 66%] 66%] major(xmajor(x, , ““CSCS””) ) takes(xtakes(x, , ““DBDB””) ) ??grade(xgrade(x, , ““AA””) ) [1%, 75%][1%, 75%]––具体应用:利润最大化具体应用:利润最大化??商品货架设计:更加适合客户的购物路径商品货架设计:更加适合客户的购物路径??货存安排:实现超市的零库存管理货存安排:实现超市的零库存管理??用户分类:提供个性化的服务用户分类:提供个性化的服务2016-9-292016-9-2966分类与预测分类与预测??分类与预测(分类与预测(Classification and PredictionClassification and Prediction))––研究已分类资料的特征,分析对象属性,据此建立一个研究已分类资料的特征,分析对象属性,据此建立一个分类函数或分类模型,然后运用该模型计算总结出的数分类函数或分类模型,然后运用该模型计算总结出的数据特征,将其他未经分类或新的数据分派到不同的组中。据特征,将其他未经分类或新的数据分派到不同的组中。––预测是根据对象属性、过去的观察值和有关资料对该属预测是根据对象属性、过去的观察值和有关资料对该属性的未来值进行预测,预测使用的技巧主要是回归分析、性的未来值进行预测,预测使用的技巧主要是回归分析、神经网络方法等。神经网络方法等。2016-9-292016-9-2977分类与预测分类与预测––常用方法常用方法??决策树(决策树(decision treedecision tree))??贝叶斯分类(贝叶斯分类(bayesbayes classification classification))??人工神经网络(人工神经网络(ANNANN))??KK最近邻分类法(最近邻分类法(k-nearest neighbor classifierk-nearest neighbor classifier))??基于事例的推理(基于事例的推理(case-based reasoningcase-based reasoning))??遗传算法(遗传算法(ic ic algorithm))??粗糙集方法(粗糙集方法(rough set approachrough set approach))??模糊集方法(模糊集方法(fuzzy set approachfuzzy set app