1 / 4
文档名称:

k均值算法.doc

格式:doc   大小:26KB   页数:4页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

k均值算法.doc

上传人:1542605778 2022/4/17 文件大小:26 KB

下载得到文件列表

k均值算法.doc

文档介绍

文档介绍:二、K-均值聚类法:
K-means算法是硬聚类算法,是典型的局域原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对二、K-均值聚类法:
K-means算法是硬聚类算法,是典型的局域原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最有分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。
K-均值算法的聚类准则是使每一聚类中,多模式点到该类别的中心的距离的平方和最小。其基本思想是:通过迭代,主次移动各类的中心,直到得到最好的聚类为止。其算法框图如图所示。
开始
选择m个中心Z1,Z2,···Zm
所有像元分到m个集群中心
计算新的集群中心
聚类中心不变
结束
具体的计算步骤如下:假设图像上的目标要分为m类,m为已知数。
第一步:适当地选取m个类的初始中心Z1(1),Z2(1),···,ZM(1),初始中心的选择对聚类结果有一定的影响,初始中心的选择一般有如下几种方法:
根据问题的性质和经验确定类别数m,从数据中找出直观上看来比较适合的m个类的初始中心。
将全部数据随即地分为m个类型,计算每类的重心,将这些重心作为m个类的初始中心。
第二步:在第k次迭代中,对任一样本X按如下的方法把它调整到m个类别中的某一类别中去。对于所有的i≠ j,i = 1,2,···,m, 如果∥X-Zj(k)∥﹤∥X-Zi(k)∥,则X∈Sj(k)其中Sj(k)是以Zi(k)为中心的类。
第三步:由第二步得到Sj(k)类新的中心
Zj(k),Zj(k)=
式中,Nj为Sj(k)类中的样本数。Zj(k+1)是按照使J最小的原则确定的,J的表达式为:
J=
第四步:对于所有的i=1,2···,m,如果Zi(k+1)=Zi(k),则迭代结束,否则转到第二步继续迭代。
这种算法的结果受到所选聚类中心的数目和其初始位置以及模式分布的几何性质和读入次序等因素的影响,并且在迭代过程中又没有调整类数的措施,因此可能产生不同的初始分类得到不同的结果,这是这种方法的缺点。可以通过其他的简单的聚