1 / 84
文档名称:

数据挖掘聚类分析.pptx

格式:pptx   大小:8,893KB   页数:84页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘聚类分析.pptx

上传人:wz_198613 2021/2/16 文件大小:8.68 MB

下载得到文件列表

数据挖掘聚类分析.pptx

文档介绍

文档介绍:引言
“物以类聚,人以群分”。对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法。因此,分类学已成为人们认识世界的一门基础科学。
在生物、经济、社会、人口等领域的研究中,存在着大量量化分类研究。例如:在生物学中,为了研究生物的演变,生物学家需要根据各种生物不同的特征对生物进行分类。
在经济研究中,为了研究不同地区城镇居民生活中的收入和消费情况,往往需要划分不同的类型去研究。
在地质学中,为了研究矿物勘探,需要根据各种矿石的化学和物理性质和所含化学成分把它们归于不同的矿石类。
在人口学研究中,需要构造人口生育分类模式、人口死亡分类状况,以此来研究人口的生育和死亡规律。
但历史上这些分类方法多半是人们主要依靠经验作定性分类,致使许多分类带有主观性和任意性,不能很好地揭示客观事物内在的本质差别与联系;特别是对于多因素、多指标的分类问题,定性分类的准确性不好把握。
为了克服定性分类存在的不足,人们把数学方法引入分类中,形成了数值分类学。
后来随着多元统计分析的发展,从数值分类学中逐渐分离出了聚类分析方法。
随着计算机技术的不断发展,利用数学方法研究分类不仅非常必要而且完全可能,因此近年来,聚类分析的理论和应用得到了迅速的发展。
聚类分析就是分析如何对样品(或变量-在多元统计中,它就是一个向量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。Q型聚类是对样品进行分类处理,R型聚类是对变量进行分类处理。
什么是聚类
聚类(clustering)就是将数据分组成多个簇(cluster),使得同一个簇的对象之间具有较高的相似度,不同簇的对象相异
早在孩提时代,人就通过不断改进下意识中的聚类模式来学会如何区分猫和狗、动物和植物
聚类无所不在
聚类的应用领域
有贡献的领域
什么情况下应该聚类
聚类分析原理