1 / 33
文档名称:

大数据十大经典算法讲解.ppt

格式:ppt   大小:4,689KB   页数:33页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据十大经典算法讲解.ppt

上传人:分享精品 2017/6/24 文件大小:4.58 MB

下载得到文件列表

大数据十大经典算法讲解.ppt

相关文档

文档介绍

文档介绍:The algorithm of Kmeans
小组成员:徐佳、张俊飞、刘志伟、孔祥玉
主要内容:
Kmeans实战
聚类算法简介
Kmeans算法详解
Kmeans算法的缺陷及若干改进
Kmeans的单机实现与分布式实现策略
聚类算法简介
1
2
3
聚类的目标:将一组向量分成若干组,组内数据是相似的,而组间数据是有较明显差异。
与分类区别:分类与聚类最大的区别在于分类的目标事先已知,聚类也被称为无监督机器学习
聚类手段:传统聚类算法①划分法②层次方法③基于密度方法④基于网络方法⑤基于模型方法
什么是Kmeans算法?
Q1:K是什么?A1:k是聚类算法当中类的个数。
Summary:Kmeans是用均值算法把数据分成K个类的算法!
Q2:means是什么?A2:means是均值算法。
Kmeans算法详解(1)
步骤一:取得k个初始初始中心点
Kmeans算法详解(2)
Min of three
due to the EuclidDistance
步骤二:把每个点划分进相应的簇
Kmeans算法详解(3)
Min of three
due to the EuclidDistance
步骤三:重新计算中心点
Kmeans算法详解(4)
步骤四:迭代计算中心点
Kmeans算法详解(5)
步骤五:收敛
Kmeans算法流程
从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类
计算数据中所有的点到这k个点的距离,将点归到离其最近的聚类里
调整聚类中心,即将聚类的中心移动到聚类的几何中心(即平均值)处,也就是k-means中的mean的含义
重复第2步直到聚类的中心不再移动,此时算法收敛
最后kmeans算法时间、空间复杂度是:
时间复杂度:上限为O(tKmn),下限为Ω(Kmn)其中,t为迭代次数,K为簇的数目,m为记录数,n为维数
空间复杂度:O((m+K)n),其中,K为簇的数目,m为记录数,n为维数

最近更新

2025年马原期末考试题库含答案(预热题) 38页

2025年高校教师资格证之高等教育学题库附参考.. 34页

2020年安徽师范大学植物学考研真题 3页

电脑租赁合同简洁 4页

社区工作者考试300题附答案(考试直接用) 94页

2024年福建建筑安全员知识题库附答案 31页

社区工作者考试试题库附完整答案(考点梳理).. 93页

租赁学校教室协议书(2025版) 14页

移交协议书书模板2025年通用 15页

空调购销的合同书(2025版) 15页

调味品原料运输合同 7页

签订合同书授权的委托书2025年通用 15页

简单的厂房买卖合同书(2025版) 14页

乐器学习之道-掌握技巧,提升音乐素养 31页

箱梁预应力张拉工程劳务合同书(2025版) 16页

2019上半年河南教师资格初中生物学科知识与教.. 22页

精选个人房屋租赁合同书协议书(2025版) 14页

精选协议书样本2025年通用 17页

薪酬管理方案-人力资源经理 24页

保险居间协议(劳务关系) 10页

虚拟现实解除居间合同 6页

开拓专项化学市场-新需求、新机遇与销售策略 27页

足球比赛秩序册 7页

农村污水处理长效管护机制 6页

西安市远东第二中学高一411开发利用金属矿物说.. 3页

YAMAHA数字调音台v中文使用说明书 5页

二年级下册列综合算式练习题 2页

国有企业和民营企业成立新公司合作协议范本 43页

梦的佛教解析:不还《叩梦》 2页

西方语言学流派笔记(刘润清) 27页