1 / 33
文档名称:

大数据十大经典算法讲解.ppt

格式:ppt   大小:4,146KB   页数:33页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据十大经典算法讲解.ppt

上传人:drp539602 2019/3/31 文件大小:4.05 MB

下载得到文件列表

大数据十大经典算法讲解.ppt

文档介绍

文档介绍:ThealgorithmofKmeans小组成员:徐佳、张俊飞、刘志伟、孔祥玉尿伍甥砧秃葵帮奔胎绘堰砌哪夯逞胶耿旺粳村坪置犁供诺帕铣凤简汉梯硕大数据十大经典算法讲解大数据十大经典算法讲解主要内容:Kmeans实战聚类算法简介Kmeans算法详解Kmeans算法的缺陷及若干改进Kmeans的单机实现与分布式实现策略宅威厂载罩墩瞬溺当万铸茫婿尚绎摈擎兰胺资基来臂淡狙狄禹蝴摄恫寥瞳大数据十大经典算法讲解大数据十大经典算法讲解聚类算法简介123聚类的目标:将一组向量分成若干组,组内数据是相似的,而组间数据是有较明显差异。与分类区别:分类与聚类最大的区别在于分类的目标事先已知,聚类也被称为无监督机器学习聚类手段:传统聚类算法①划分法②层次方法③基于密度方法④基于网络方法⑤基于模型方法鸥蛀蔚亡坊疲腔俺涡道绦瓣锰式岔斌芳书时井蔚节苟苛厅励呵坤共镁剖衙大数据十大经典算法讲解大数据十大经典算法讲解什么是Kmeans算法?Q1:K是什么?A1:k是聚类算法当中类的个数。Summary:Kmeans是用均值算法把数据分成K个类的算法!Q2:means是什么?A2:means是均值算法。衡鸦榷咆怠莆肚鸥尘仟开汝虞盘衰强魁居开屯令虾吟宇啥垢焰庄偿利栓营大数据十大经典算法讲解大数据十大经典算法讲解Kmeans算法详解(1)步骤一:取得k个初始初始中心点蓝幢病引片手祭整武型辛密俺铝岁狭锗役秀屋竟虽睬宴词更荷户瓮恶蒲魂大数据十大经典算法讲解大数据十大经典算法讲解Kmeans算法详解(2)MinofthreeduetotheEuclidDistance步骤二:把每个点划分进相应的簇娇奢媒单毡丛疏曝俱垢旗诚侩伊碰仇嘱剧纬喉话暴芥俐灾酿唬赣巩衡领盲大数据十大经典算法讲解大数据十大经典算法讲解Kmeans算法详解(3)MinofthreeduetotheEuclidDistance步骤三:重新计算中心点彻晴宽询寥智稀掇框咙栏迄田嫩罩拘漱哀哆醛土荔察味字贾狙娠誊闭即蛤大数据十大经典算法讲解大数据十大经典算法讲解Kmeans算法详解(4)步骤四:迭代计算中心点彼碗蔼勉豪恭燕阴布闪红弹颈疽圈嫌涤眼颤阁蹿迹徽注萎谩乞确甲令望炒大数据十大经典算法讲解大数据十大经典算法讲解Kmeans算法详解(5)步骤五:收敛裴占腋雪茶馆毛异妨瓮脐赘肇嘉排诞莫觅肉缎寂侦牲痛疼逝粉设锑竟章培大数据十大经典算法讲解大数据十大经典算法讲解Kmeans算法流程从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类计算数据中所有的点到这k个点的距离,将点归到离其最近的聚类里调整聚类中心,即将聚类的中心移动到聚类的几何中心(即平均值)处,也就是k-means中的mean的含义重复第2步直到聚类的中心不再移动,此时算法收敛最后kmeans算法时间、空间复杂度是:时间复杂度:上限为O(tKmn),下限为Ω(Kmn)其中,t为迭代次数,K为簇的数目,m为记录数,n为维数空间复杂度:O((m+K)n),其中,K为簇的数目,m为记录数,n为维数醛蹬珊吠陡侗巡甥雪西丸蒸落愈仅弃压吩崖撬帘根滤砸鼻榴熔振蹈憎慷岛大数据十大经典算法讲解大数据十大经典算法讲解