1 / 19
文档名称:

谱聚类算法.pptx

格式:pptx   大小:348KB   页数:19页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

谱聚类算法.pptx

上传人:今晚不太方便 2017/8/4 文件大小:348 KB

下载得到文件列表

谱聚类算法.pptx

文档介绍

文档介绍:Spectral Clustering algorithm 谱聚类算法
组长:
小组成员:

聚类( clustering) 就是将数据对象分组成为多个类或簇(cluster) , 使得在同一簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。传统的聚类算法, 如k-means算法、EM 算法等都是建立在凸球形的样本空间上, 但当样本空间不为凸时, 算法会陷入局部最优。
为了能在任意形状的样本空间上聚类, 且收敛于全局最优解, 学者们开始研究一类新型的聚类算法, 称为谱聚类算法(Spectral Clustering Algorithm) 。
算法概念:
该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵, 并计算矩阵的特征值和特征向量, 然后选择合适的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉、VLSI 设计等领域, 最近才开始用于机器学习中, 并迅速成为国际上机器学习领域的研究热点。
谱聚类算法建立在图论中的谱图理论基础上, 其本质是将聚类问题转化为图的最优划分问题, 是一种点对聚类算法,对数据聚类具有很好的应用前景。
图划分准则:
谱聚类算法的思想来源于谱图划分理论。假定将每个数据样本看作图中的顶点V, 根据样本间的相似度将顶点间的边E赋权重值W, 这样就得到一个基于样本相似度的无向加权图G= (V, E) 。那么在图G 中, 就可将聚类问题转化为在图G 上的图划分问题。基于图论的最优划分准则就是使划分成的两个子图内部相似度最大, 子图之间的相似度最小。划分准则的好坏直接影响到聚类结果的优劣。常见的划分准则有Minimum cut, Average cut, Normalized cut, Min2 max cut, Ratio cut, MNcut 等。下面我们将分别介绍这几种准则。
基本理论:
谱图理论中, 将图G 划分为A , B 两个子图的代价函数为:

通过最小化上述剪切值来划分图G, 这一划分准则被称为最小割集准则。他们用这个准则对一些图像进行分割, 并产生了较好的效果, 同时他们也注意到, 该准则容易出现歪斜( 即偏向小区域) 分割。规范割集准则及比例割集准则均可避免这种情况的发生。
最小割集准则:(Minimum cut)







1
2
3
4
5
6

A
B
cut(A,B) =
Shi 和Malik 在2000 年建立了规范割集目标函数(Ncut) :
Vol(A)、 Vol(B)分别是子图A, B 内所有顶点之间的连接权值之和。
最小化Ncut 函数被称为规范割集准则。该准则不仅能够衡量类内样本间的相似程度, 也能衡量类间样本间的相异
程度。通常情况下都是通过最小化Ncut 函数获取图的最优划分。
规范割集准则:(Normalized cut)
Hagen 和Kahng 提出了比例割目标函数(Rcut) :
其中| A| , | B| 分别表示子图A, B 中顶点的个数。最小化
Rcut 函数只考虑了类间相似性最小, 减小了过分割的可能
性, 但运行速度较慢。
比例割集准则:(Ratio cut)
平均割目标函数为:
可以看出Avcut 和Ncut 函数都表示无向图G 中边界损失与分割区域相关性的比值之和, 因此最小化Avcut 与Ncut目标函数都能产生较准确的划分。其共同缺点是倾向于欠分割且易分割出只包含几个顶点的较小子图。文献通过实验发现, 当把Normalized cut 和Average cut 准则分别用于同一图像的分割问题时, Normalized cut 准则能够产生更好的划分结果。
平均割集准则: (Average cut)
最小最大割集准则要求最小化cut( A, B) 的同时, 最大化vol( A) 与vol( B) 。该准则可通过最小化下面的目标函数得以实现:
我们将这个目标函数称为最小最大割函数, 或简称为Mcut 函数。最小化该函数可避免分割出仅包含几个顶点的较小子图, 因此它倾向于产生平衡割集, 但实现速度较慢。Mcut 与Ncut 一样满足类间样本间的相似度小而类内样本间的相似度大的原则, 与Ncut 具有相似的行为, 但当类间重叠较大时,Mcut 比Ncut 更加高效。
最小最大割集准则: ( Minmax cut)
上述五种划分准则所使用的目标函数都是将图G 划分为2 个子图的划分函数, Meila 提出一种可以将图G同时划分为k 个子图的规范割目标函数:
其中:
Melia 指出Ncut 和MNcut 的差异之处仅在于所使用的
谱映射不同, 并且

最近更新

早上开早会开场白范文(3篇) 2页

2025版部分股权债权转化合同范本 16页

有关个人销售计划集合(29篇) 56页

2025版铝合金承包合同范本 14页

2025版闭口采购网络安全合同 14页

2025版韵达快递业务承包合同附社会责任履行条.. 13页

有关英语科的工作总结范文(6篇) 20页

有关高中的作文600字汇编7篇 10页

2025版餐饮业快餐店租赁合同附带品牌加盟服务.. 14页

2025版餐饮企业食品安全管理培训合同 13页

2025版餐饮店食品安全风险评估合同 14页

桔子的小学作文合集5篇 6页

2025版高端设备采购合同模板 17页

二零二五年办公室装修工程环保建材采购施工合.. 13页

核心素养视角下的小学科学实验教学策略新探索.. 15页

广西娱乐餐饮行业劳动合同书范本 13页

2025版高效快捷板梁运输吊装服务协议 15页

2025版高端不锈钢栏杆采购与服务合同 17页

2025版高端精密材料采购合同规范文本 17页

2025版,智能家居设备有备无患维修保养合同 14页

2025电商推广合同范本 15页

2025租车协议合同范本免费下载 13页

2025苗圃技术员职业合同 14页

2025通用13合同商定与市场推广通用条款 16页

2025鲅鱼圈区房地产开发项目合作协议 15页

「二零二四版成都上灶师父餐饮业招聘与职业培.. 15页

临时劳务用工合同书2025年通用 14页

二零二五年DJ培训机构聘用教师合同 16页

二零二五年SET协议在电子商务支付安全认证中的.. 17页

二零二五年专业赛事场地维护保养合同 17页