1 / 7
文档名称:

各种聚类算法介绍及对比.docx

格式:docx   大小:25KB   页数:7页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

各种聚类算法介绍及对比.docx

上传人:cby201601 2021/7/13 文件大小:25 KB

下载得到文件列表

各种聚类算法介绍及对比.docx

相关文档

文档介绍

文档介绍:、层次聚类
1、层次聚类的原理及分类
)层次法( Hierarchical methods ) 先计算样本之间的距离。每次将距离最近的点合并到同
一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,
直到合成了一个类。 其中类与类的距离的计算方法有:最短距离法,最长距离法, 中间距离
法,类平均法等。比如最短距离法,将类与类的距离定义为类与类之间样本的最短距离。
层次聚类算法根据层次分解的顺序分为: 自下底向上和自上向下, 即凝聚的层次聚类算法和
分裂的层次聚类算法( agglomerative 和 divisive ),也可以理解为自下而上法( bottom-up )
和自上而下法( top-down )。 自下而上法就是一开始每个个体( object )都是一个类,然后
根据 linkage 寻找同类,最后形成一个“类”。自上而下法就是反过来,一开始所有个体都
属于一个“类”,然后根据 linkage 排除异己,最后每个个体都成为一个“类”。 这两种路
方法没有孰优孰劣之分, 只是在实际应用的时候要根据数据特点以及你想要的 “类” 的个数,
来考虑是自上而下更快还是自下而上更快。至于根据 Linkage 判断“类”的方法就是最短距
离法、 最长距离法、 中间距离法、类平均法等等(其中类平均法往往被认为是最常用也最好
用的方法,一方面因为其良好的单调性,另一方面因为其空间扩张 / 浓缩的程度适中)。为
弥补分解与合并的不足,层次合并经常要与其它聚类方法相结合,如循环定位。
) Hierarchical methods 中比较新的算法有 BIRCH( Balanced Iterative Reducing and Clustering
Using Hierarchies 利用层次方法的平衡迭代规约和聚类)主要是在数据量很大的时候使用,
而且数据类型是 numerical 。 首先利用树的结构对对象集进行划分,然后再利用其它聚类方
法对这些聚类进行优化; ROCK( A Hierarchical Clustering Algorithm for Categorical Attributes ) 主要用在 categorical 的数据类型上 ; Chameleon( A Hierarchical Clustering Algorithm Using
Dynamic Modeling )里用到的 linkage 是 kNN( k-nearest-neighbor )算法, 并以此构建一个 graph ,
Chameleon的聚类效果被认为非常强大,比 BIRCH好用,但运算复杂度很高, 0(门人2)。
2、层次聚类的流程
凝聚型层次聚类的策略是先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,
直到所有对象都在一个簇中, 或者某个终结条件被满足。 绝大多数层次聚类属于凝聚型层次
聚类,它们只是在簇间相似度的定义上有所不同。 这里给出采用最小距离的凝聚层次聚类
算法流程:
将每个对象看作一类,计算两两之间的最小距离;
将距离最小的两个类合并成一个新类;
重新计算新类与所有类之间的距离;
重复 (2) 、 (3) ,直到所有类最后合并成一类。
聚类的效果如下图,

最近更新

消费金融场景化产品创新及2025年用户增长策略.. 23页

淡雅彩色水墨画荷花PPT背景 26页

中国现代文学史(上)试题A及参考答案 5页

深空探索主题2025年度颁奖典礼动态星空蓝背景.. 22页

2023年二级建造师考试市政公用工程管理与实务.. 274页

牡丹花系个人述职报告PPT模板 21页

中国板材之都 8页

中国无缝服装市场营销现状深度分析与未来发展.. 26页

物业采购方案 76页

生态农场研学课程配套课件模板(2025年劳动教.. 27页

生物医药实验室2025危化品管理全流程标准化培.. 25页

中国居民膳食指南和平衡膳食宝塔制定的意义 4页

社区服务组织二零二五年低碳生活推广成效评估.. 24页

科技创新成果发布与2025年度团队颁奖PPT动态图.. 25页

餐饮部服务质量检查制度 1页

中国光伏行业研究报告 18页

红色商务风法律毕业答辩PPT通用模板 28页

红色立体模块2025应收账款账期管理与现金流优.. 22页

红金中国风2025高考志愿填报指南PPT课件设计 32页

肝素钠生产新工艺流程 12页

大班七月份工作总结 11页

施工厂商EHS协议书:安全施工管理 8页

项目工程月报模板 4页

2023年专业四级完形填空真题及答案实用 7页

埋线治疗知情同意书精选 1页

以赛亚书第27章 从救赎史的观点看圣经 8页

170t蔗渣锅炉炉介绍 29页

园林树木学陈有民 《园林树木学》 9页

GBT 15166.4-1994 交流高压熔断器 通用试验方.. 5页

世光测光表使用说明 10页