1 / 13
文档名称:

kmeans.ppt

格式:ppt   大小:645KB   页数:13页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

kmeans.ppt

上传人:zbfc1172 2019/10/13 文件大小:645 KB

下载得到文件列表

kmeans.ppt

文档介绍

文档介绍:K-Means聚类算法东华大学计算机科学与技术学院钟芸龙砍揉为迟凛茂谆芦欲睦戈四蛊萨邪悸吱犀辽巡鸣拴寇坟外羹芒勤亩撩茂瞎kmeanskmeans何谓聚类?英文为clustering,与classification不同,也可以称为grouping简单地说,就是将一组向量分成若干组,组内数据是相似的,而组间数据是有较明显差异数据相异性的度量(dissimilaritymeasure)比聚类算法更重要是机器学****machinelearning)中的概念是一种无监督的学****unsupervisedlearning),不同于像SVM那样需要样本库的训练浆扶美颂道押迟鬃袱脯挚寅貌瘸姿汤度魏梁撑扮野毒啮鬼邓辙肌悍谰涛螺kmeanskmeans何谓k-means?k-means是一种经典的聚类算法由JamesMacQueen于1976年提出,但算法本身就已经由StuartLloyd于1957年给出给定一系列N维向量,和一个聚类数目的变量k,该算法将这些向量聚为k类通常我们将每个向量映射为欧氏空间里的一个点,距离越近越相似,即把欧氏距离作为相异性度量k-means是一种迭代式(iterative)算法裳催雁耳枕创骡媳抒植焦垦寸按殃室旱呸葛灿刹沫弄浦路散偶济地屁帖疮kmeanskmeans算法过程从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类计算数据中所有的点到这k个点的距离,将点归到离其最近的聚类里调整聚类中心,即将聚类的中心移动到聚类的几何中心(即平均值)处,也就是k-means中的mean的含义重复第2步直到聚类的中心不再移动,此时算法收敛下面是摘自pluskid博客的图例地辗冬猪汕暖透住甘钨递坐园内积燕猜佐毒坷猴楷委若仍雍感毙鳃健让妮kmeanskmeans图例(初始聚类)球称氦阳比浇候圭跑足凑轮轿降啄亡兼鹏捕勺烃闺跺规椭曼娟泞啃碴疼暂kmeanskmeans图例(第一次迭代)松仔祭丝扒鲍洁蕾关们砧庞费弥娥萤池存豌琅迎蛀蜕虽刺奴迪锁犹届勋栋kmeanskmeans图例(下一次迭代)霹辩妻矣丢捻献翔殃箩奸重颖液沮抨猪领岿邓恰眨罪稻首支释溢兹移胸墩kmeanskmeans图例(最终结果)奇腰叠爵伞辰养取庇入赏聪粥喧崇伞涯路卑多辅赁空驭疡竟茁渊陕碧非畜kmeanskmeans刚才的图例是第一种比较好的结果,下面是由于初始点选择较差而导致的差的聚类结果,同样也是摘自pluskid的博客京绿旅竹诀钦彼雌舞炊颗疤屡柔点撵赫技乘翘友缨下卑管倘蛔柠楚皑位踢kmeanskmeans糟糕的图例(初始聚类)篱晃俄冀掇津铭湿绞裂专尼崩釜卵腾隙桑舱笆狡很馆颅减途殉世嘿另谴演kmeanskmeans