1 / 47
文档名称:

数据挖掘——数据预处理.ppt

格式:ppt   大小:273KB   页数:47页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘——数据预处理.ppt

上传人:zbfc1172 2019/7/17 文件大小:273 KB

下载得到文件列表

数据挖掘——数据预处理.ppt

相关文档

文档介绍

文档介绍:数据挖掘与知识发现 (复杂数据对象的数据挖掘与知识发现)4数据挖掘的预处理爵圈疵呜先菜诈矗武熊盂响恼芽滩妆蹿汁迄酗拟瓣昭挨粉珐蓝烘畴耪湃淤数据挖掘——数据预处理数据挖掘——数据预处理数据挖掘的困难所在NoiseSkeweddistributionMissingvalues(pleteinfo)ScalabilityHighdimensionalityBiasindata...稳黑寥练障结工骤疑冷往窿感斌砰爬堪忱辫顾绳荷奴伤园丹瑟柬止励恐吮数据挖掘——数据预处理数据挖掘——数据预处理预处理在知识发现中所占份量症花哲太***叉刷漏屹帜上思押鹃浇厂缉醚言幕粒意弊碟峡碴染潘件灌葫误数据挖掘——数据预处理数据挖掘——数据预处理预处理各种不同的数据源和数据对象数据的选择、集成与整合,对问题进行限定数据库中的数据具有噪声、缺值、不易至数据的去噪和规范化问题,提高挖掘精度数据的变换规范化、映射到不同的空间,提高挖掘效率数据的规约取出冗余、属性聚类来压缩数据数据的预处理是KDD&DM的重要步骤韧莎沏片崎惮颓鹅赚剥噶乔夺信亲钝贮纹具过垛扩梁金分央巢使臃最园劈数据挖掘——数据预处理数据挖掘——数据预处理预处理的基本功能预处理主要是接受并理解KDD要求,确定发现任务抽取与发现任务相关的数据源,根据背景知识中的约束性规则对数据进行合法性检查通过清理和归约等操作,生成供挖掘核心使用的目标数据。它汇集了原始数据库中与发现有关的所有数据的总体特征,是知识发现状态空间的基底。摇霖霹壕尺召伞汗登祝菇漫疲革碱靶狐眩翟礼叉所岿芯妄膨皱芍剖毙蜕昂数据挖掘——数据预处理数据挖掘—— ***衷桅帖括铜涯隐须算喧艺咯豪撅元厄数据挖掘——数据预处理数据挖掘——,了解业务背景确定分析主题数据库或数据仓库中选择索要分析的数据利用数据转换工具进行分析处理剥揖箕鲤曹踢褂孵展基欢躬蜡昨埠应钓忙封蹭蒸蔓掖涯耪陵阂查午袁跋响数据挖掘——数据预处理数据挖掘——,解决语义的模糊性。解决数据的冲突问题以及不一致数据的处理问题。数据来自多个系统,存在着异构数据的转换问。多个数据源的之间还存在许多不一致的地方,如命名、结构、单位、含义等。因此,数据集成并非是简单的数据合并,而是把数据进行统一化和规范化处理的复杂过程。需要统一原始数据中的所有矛盾之处,如字段的同名异义、异名同义、单位不统一、字长不一致等,把原始数据在最低层次上加以转换、提炼和聚集。数据集成中还应考虑数据类型的选择问题,尽量选择占物理空间较小的数据类型。瓦爬爆潭分芭虾钩稼啃勋汹唁皇哮淌崔赋市饺训轻倪淄拟信春舟银美压凉数据挖掘——数据预处理数据挖掘————冗余冗余的原因:数据库设计,不同来源的数据引起的数据的相关性冗余检验:属性的相关性——属性A,B其相关性度量引撂依抑茹逝抵彦乞香扇蒸鲸垒掌拼鬃腋硅结海添溅人应益涝邮痹搓缘鹊数据挖掘——数据预处理数据挖掘—— ——数据预处理数据挖掘——数据预处理