1 / 12
文档名称:

数据挖掘技术.ppt

格式:ppt   页数:12页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘技术.ppt

上传人:sxlw2016 2016/4/25 文件大小:0 KB

下载得到文件列表

数据挖掘技术.ppt

文档介绍

文档介绍:数据挖掘技术定义?数据挖掘( DataMining )就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。?分析客户使用分销渠道的情况和分销渠道的容量;建立利润评测模型;客户关系优化;风险控制等。?汇丰银行需要对不断增长的客户群进行分类,对每种产品找出最有价值的客户,通过数据挖掘的方法使营销费用减少了 30 %。实例关联分析( associationanalysis ) ?两个或两个以上变量的取值之间存在某种规律性, 就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。聚类分析( clusteringanalysis ) ?聚类是把数据按照相似性归纳成若干类别, 同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念, 发现数据的分布模式,以及可能的数据属性之间的相互关系。分类(classification) ?分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。实例?美国 Firstar 银行使用数据挖掘工具,根据客户的消费模式预测何时为客户提供何种产品。? GUS 日用品零售商店需要准确的预测未来的商品销售量,降低库存成本,通过数据挖掘的方法使库存成本比原来减少了 % 。预测(prediction) ?预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。时序模式(time- seriespattern ) ?时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。偏差分析( deviationanalysis ) ?在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数剧存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。

最近更新

2024年保密知识题库附答案【典型题】 35页

2024年公务员考试常识题400道附精品答案 110页

2024年大学计算机基础等级考试题库含完整答案.. 21页

2024年大学计算机考试题库800道精品【易错题】.. 147页

2024年职业教育法考试题库100道带答案ab卷 17页

2024年马原测试题及一套完整答案 78页

2024年马原试题(夺分金卷) 79页

《马克思主义基本原理概论》试题库附答案【巩.. 78页

中国历史文化知识竞赛100题(重点) 14页

全国计算机二级考试试题题库及答案(夺冠) 96页

全国计算机等级考试(二级)考试题库完整答案.. 128页

历史类常识经典考试题100题附答案(突破训练).. 14页

县乡教师选调进城考试-教育法律法规经典题库及.. 103页

县乡教师选调进城考试-教育法律法规题库含答案.. 102页

县乡教师选调进城考试《教育心理学》题库附完.. 121页

大学生计算机基础考试题库【历年真题】 21页

大学计算机基础期末考试题库及完整答案(各地.. 21页

大学计算机基础练习试题最新 21页

大学计算机基础考试试题200道精编答案 29页

法律基础知识500题word 146页

计算机二级真题题库带答案(培优b卷) 82页

计算机网络复习题附完整答案【夺冠】 29页

马克思主义基本原理考试题库【考点提分】 79页

马原考试复习题500道带答案(新) 95页

2024年保密员考试题库ab卷 35页

交警劳务派遣合同 3页

乡镇卫生院医疗质量管理考核评分标准 9页

2023晚上的晚祷范文七篇 8页

2015年度门球竞赛规则 42页

《佛说天地八阳神咒经》注音版(可直接A4纸打印.. 13页