1 / 12
文档名称:

KMEANS算法K均值算法.docx

格式:docx   大小:230KB   页数:12页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

KMEANS算法K均值算法.docx

上传人:春天资料屋 2021/11/29 文件大小:230 KB

下载得到文件列表

KMEANS算法K均值算法.docx

相关文档

文档介绍

文档介绍:KMEANS算法K均值算法
KMEANS算法K均值算法
KMEANS算法K均值算法
合用标准文案
k-means 算法
一.算法简介
-means 算法,也被称 k- 平均或 k- 均 ,是一种获取最广泛使用的聚 算法。 它是将各个聚 子集内的所有数据 本的均 作 聚 的代表点,算法的主要思想是通 迭代 程把数据集划分 不相同的 , 使得 价聚 性能的准 函数到达最 , 从而使生成的每个聚 内 凑, 独立。 一算法不适合 理失散型属性,但是 于 型拥有 好的聚 收效。
二.划分聚类方法对数据集进行聚类时包括以下三个要点:
〔 1〕 定某种距离作 数据 本 的相似性胸襟
k-means 聚 算法不适合 理失散型属性, 型属性比 适合。所以在 算数据 本之 的距离 , 可以依照 需要 欧式距离、 曼哈 距离也许明考斯距离中的一种来作 算法的相似性胸襟, 其中最常用的是欧式距离。 下面我 大家详尽介 一下欧式距离。
X
xm | m 1,2,..., total

假 定的数据集
,X中的 本用 d 个描述属性 A ,A
1
2
Ad 来表示,而且
d 个描述属性都是 型属性。数据 本xi =(x i1
,x i2 , ⋯ xid ),
xj =(x j1 ,x j2 , ⋯xjd
) 其中,xi1 ,x i2
, ⋯xid 和 xj1 ,x j2 , ⋯xjd 分 是 本 xi 和 xj
d 个描
述属性 A1 ,A 2, ⋯Ad 的详尽取 。 本 xi 和 xj 之 的相似度平时用它 之 的距
离 d(x i ,x j ) 来表示,距离越小, 本 xi 和 xj 越相似,差异度越小;距离越大, 本 xi 和 xj 越不相似,差异度越大。
d
2
欧式距离公式以下: d xi , x j
xikxjk
k
1
〔 2〕 价聚 性能的准 函数
KMEANS算法K均值算法
KMEANS算法K均值算法
KMEANS算法K均值算法
k-means 聚 算法使用 差平方和准 函数来 价聚 性能。 定数据集 X,
优秀文档
KMEANS算法K均值算法
KMEANS算法K均值算法
KMEANS算法K均值算法
合用标准文案
其中只包括描述属性,不包括 属性。假 X 包括 k 个聚 子集 X1 ,X 2, ⋯XK;
各个聚 子集中的 本数量分 n1,n2, ⋯ ,n k; 各个聚 子集的均 代表点 〔也
称聚 中心〕分 m1, m2, ⋯ ,mk。
k
2
差平方和准 函数公式 :
E
p mi
i 1
p Xi
〔 3〕相似度的 算依照一个簇中 象的平均 来 行。
将所有 象随机分配到 k 个非空的簇中。
算每个簇的平均 ,并用 平均 代表相 的簇。
依照每个 象与各个簇中心的距离,分配 近来的簇。
尔后 2〕,重新 算每个簇的平均 。 个 程不断重复直到 足某个准 函数才停止。
三.算法描述
中心向量 c1, c 2 , ⋯, c k 初始化 k 个种子
分 :
将 本分配 距离其近来的中心向量
由 些 本构造不订交〔 non-overlapping 〕的聚
确定中心 :
用各个聚 的中心向量作 新的中心
重复分 和确定中心的步 ,直至算法收
四.算法流程
入:簇的数量 k 和包括 n 个 象的数据 。
出: k 个簇,使平方 差准 最小。
算法步 :
每个聚 确定一个初始聚 中心, 就有 K 个初始聚 中心。
将 本集中的 本依照最小距离原 分配到最 近聚
使用每个聚 中的 本均 作 新的聚 中心。
KMEANS算法K均值算法
KMEANS算法K均值算法
KMEANS算法K均值算法
优秀文档
KMEANS算法K均值算法
KMEANS算法K均值算法
KMEANS算法K均值算法
合用标准文案
重复步骤 步直到聚类中心不再变化。
结束,获取 K 个聚类
五.算法举例