1 / 32
文档名称:

聚类分析—Kmeans and Kmedoids聚类 ppt课件.ppt

格式:ppt   大小:498KB   页数:32页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

聚类分析—Kmeans and Kmedoids聚类 ppt课件.ppt

上传人:幻影 2019/12/18 文件大小:498 KB

下载得到文件列表

聚类分析—Kmeans and Kmedoids聚类 ppt课件.ppt

文档介绍

文档介绍:数据挖掘Topic3--聚类分析K-means&K-medoids聚类主要内容K-means算法Matlab程序实现在图像分割上的简单应用K-medoids算法k-中心点聚类算法--PAMK-medoids改进算法基于划分的聚类方法构造n个对象数据库D的划分,将其划分成k个聚类启发式方法:k-平均值(k-means)和k-中心点(k-medoids)算法k-平均值(MacQueen’67):每个簇用该簇中对象的平均值来表示k-中心点或PAM(Partitionaroundmedoids)(Kaufman&Rousseeuw’87):每个簇用接近聚类中心的一个对象来表示这些启发式算法适合发现中小规模数据库中的球状聚类对于大规模数据库和处理任意形状的聚类,这些算法需要进一步扩展K-means聚类算法算法描述为中心向量c1,c2,…,ck初始化k个种子分组:将样本分配给距离其最近的中心向量由这些样本构造不相交(non-overlapping)的聚类确定中心:用各个聚类的中心向量作为新的中心重复分组和确定中心的步骤,直至算法收敛K-means聚类算法(续)算法的具体过程从数据集中任意选取k个赋给初始的聚类中心c1,c2,…,ck;对数据集中的每个样本点xi,计算其与各个聚类中心cj的欧氏距离并获取其类别标号:按下式重新计算k个聚类中心;重复步骤2和步骤3,直到达到最大迭代次数为止。Matlab程序实现function[M,j,e]=kmeans(X,K,Max_Its)[N,D]=size(X);I=randperm(N);M=X(I(1:K),:);Mo=M;forn=1:Max_Itsfork=1:KDist(:,k)=sum((X-repmat(M(k,:),N,1)).^2,2)';end[i,j]=min(Dist,[],2);fork=1:Kifsize(find(j==k))>0M(k,:)=mean(X(find(j==k),:));endendMatlab程序实现(续)Z=zeros(N,K);form=1:NZ(m,j(m))=1;ende=sum(sum(Z.*Dist)./N);fprintf('%dError=%f\n',n,e);Mo=M;endk-平均聚类算法(续)例0123456789100123456789100123456789100**********K=2任意选择K个对象作为初始聚类中心将每个对象赋给最类似的中心更新簇的平均值重新赋值更新簇的平均值重新赋值在图像分割上的简单应用例1:图片:一只遥望大海的小狗;此图为100x100像素的JPG图片,每个像素可以表示为三维向量(分别对应JPEG图像中的红色、绿色和蓝色通道);将图片分割为合适的背景区域(三个)和前景区域(小狗);使用K-means算法对图像进行分割。在图像分割上的简单应用(续)分割后的效果注:最大迭代次数为20次,需运行多次才有可能得到较好的效果。