1 / 33
文档名称:

数据挖掘层次聚类学习教案.pptx

格式:pptx   大小:260KB   页数:33页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘层次聚类学习教案.pptx

上传人:wz_198613 2021/12/28 文件大小:260 KB

下载得到文件列表

数据挖掘层次聚类学习教案.pptx

相关文档

文档介绍

文档介绍:会计学
1
数据挖掘层次(céngcì)聚类
第一页,共33页。
2021/10/29
2
层次聚类方法(fāngfǎ)概述
凝聚(níngjù)的层次聚类:一种自底向上的策略,首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到某个终结条件被满足。
分裂的层次聚类:采用自顶向下的策略,它首先将所有对象置于一个簇中,然后逐渐细分为越来越小的簇,直到达到了某个终结条件。
层次凝聚(níngjù)的代表是AGNES算法。层次分裂的代表是DIANA算法。
第1页/共33页
第二页,共33页。
2021/10/29
3
簇间距离(jùlí)
最小距离(jùlí)
第2页/共33页
第三页,共33页。
2021/10/29
4
簇间距离(jùlí)
最大距离(jùlí)
第3页/共33页
第四页,共33页。
2021/10/29
5
簇间距离(jùlí)
平均(píngjūn)距离
第4页/共33页
第五页,共33页。
2021/10/29
6
簇间距离(jùlí)
均值(jūn zhí)距离


第5页/共33页
第六页,共33页。
2021/10/29
7
AGNES算法(suàn fǎ)
AGNES(AGglomerative NESting)算法最初将每个对象作为一个簇,然后这些簇根据某些准则被一步步地合并。
两个(liǎnɡ ɡè)簇间的相似度由这两个(liǎnɡ ɡè)不同簇中距离最近的数据点对的相似度来确定。
聚类的合并过程反复进行直到所有的对象最终满足簇数目。
第6页/共33页
第七页,共33页。
2021/10/29
8
AGNES算法(suàn fǎ)
输入:n个对象(duìxiàng),终止条件簇的数目k。
输出:k个簇,达到终止条件规定簇数目。
(1)将每个对象(duìxiàng)当成一个初始簇;
(2)REPEAT
(3)根据两个簇中最近的数据点找到最近的两个簇;
(4)合并两个簇,生成新的簇的集合;
(5)UNTIL达到定义的簇的数目;
第7页/共33页
第八页,共33页。
2021/10/29
9
AGNES算法(suàn fǎ)例题
序号 属性(shǔxìng)1 属性(shǔxìng)2
1 1 1
2 1 2
3 2 1
4 2 2
5 3 4
6 3 5
7 4 4
8 4 5
第1步:根据初始簇计算每个簇之间的距离,随机找出距离最小的两个簇,进行合并,最小距离为1,合并后1,2两个点合并为一个簇。
第2步:对上一次合并后的簇计算簇间距离,找出距离最近的两个簇进行合并,合并后3,4点成为(chéngwéi)一簇。
第3步:重复第2步的工作,5,6点成为(chéngwéi)一簇。
第4步:重复第2步的工作,7,8点成为(chéngwéi)一簇。
第5步:合并{1,2},{3,4}成为(chéngwéi)一个包含四个点的簇。
第6步:合并{5,6},{7,8},由于合并后的簇的数目已经达到了用户输入的终止条件,程序终止。
步骤 最近的簇距离 最近的两个簇 合并后的新簇
1 1 {1},{2} {1,2},{3},{4},{5},{6},{7},{8}
1 {3},{4} {1,2},{3,4},{5},{6},{7},{8}
1 {5},{6} {1,2},{3,4},{5,6},{7},{8}
1 {7},{8}