1 / 110
文档名称:

聚类分析 ppt课件.ppt

格式:ppt   大小:1,366KB   页数:110页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析 ppt课件.ppt

上传人:幻影 2021/11/30 文件大小:1.33 MB

下载得到文件列表

聚类分析 ppt课件.ppt

文档介绍

文档介绍:聚类分析
第五章 聚类分析
()
E-mail:
精品资料
你怎么称呼老师?
如果老师最后没有总结一节课的重点的难点,你是否会认为老师的教学方法需要改进?
你所经历的课堂,是讲座式还是讨论式?
教师的教鞭
“不怕太阳晒,也不怕那风雨狂,只怕先生骂我笨,没有学问无颜见爹娘 ……”
“太阳当空照,花儿对我笑,小鸟说早早早……”
第五章 聚类分析(提纲)
聚类分析概述
相似性计算方法
常用聚类方法
划分方法
k-means算法(k-均值算法)
k-medoids算法(k-中心算法)
层次方法
AGNES算法(合并聚类法)
DIANA算法(分裂聚类法)
孤立点分析
聚类分析概述
聚类分析的定义
聚类分析(Cluster Analysis)是一个将数据集中的所有数据,按照相似性划分为多个类别(Cluster, 簇)的过程;
簇是相似数据的集合。
聚类分析是一种无监督(Unsupervised Learning)分类方法:数据集中的数据没有预定义的类别标号(无训练集和训练的过程)。
要求:聚类分析之后,应尽可能保证类别相同的数据之间具有较高的相似性,而类别不同的数据之间具有较低的相似性。
聚类分析概述
聚类分析在数据挖掘中的作用:
作为一个独立的工具来获得数据集中数据的分布情况;
作为其他数据挖掘算法的预处理步骤。
聚类分析概述
聚类分析在数据挖掘中的作用:
作为一个独立的工具来获得数据集中数据的分布情况;
首先,对数据集执行聚类,获得所有簇;
然后,根据每个簇中样本的数目获得数据集中每类数据的大体分布情况。
作为其他数据挖掘算法的预处理步骤。
聚类分析概述
聚类分析在数据挖掘中的作用:
作为一个独立的工具来获得数据集中数据的分布情况;
作为其他数据挖掘算法的预处理步骤。
首先,对数据进行聚类——粗分类;
然后,分别对每个簇进行特征提取和细分类,可以有效提高分类精度。