1 / 8
文档名称:

K-means算法最佳聚类数评价指标研究.doc

格式:doc   大小:139KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

K-means算法最佳聚类数评价指标研究.doc

上传人:changjinlai 2018/2/11 文件大小:139 KB

下载得到文件列表

K-means算法最佳聚类数评价指标研究.doc

文档介绍

文档介绍:K-means算法最佳聚类数评价指标研究
郭靖侯苏
中国人民公安大学信息技术与网络安全学院
X
关注成功!
加关注后您将方便地在我的关注中得到本文献的被引频次变化的通知!
新浪微博
腾讯微博
人人网
开心网
豆瓣网
网易微博
摘    要:
聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域, 是一种无指导的观察式学****然而, 绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法, 它需要用户输入聚类数K, 但这通常非常困难。聚类数的确定是决定聚类质量的关键因素。虽然有许多被用来估计最优聚类数的聚类评价指标, 但对于不同的聚类算法, 不同的评价指标效果差异很大。为确定针对K-means聚类算法效果最好的评价指标, 采用4种典型的不同聚类结构特征的人工模拟数据以及来自UCI的真实数据集对7种评价指标的性能进行实验比较, 结果表明CH指标和I指标在评估K-means算法的最佳聚类数时效果较好。
关键词:
聚类指标; K-means算法; 聚类分析; 聚类数;
作者简介:郭靖(1991-) , 男, 湖北襄阳人, 中国人民公安大学信息技术与网络安全学院硕士研究生, 研究方向为数据挖掘;
作者简介:侯苏(1992-) , 女, 江苏徐州人, 中国人民公安大学信息技术与网络安全学院硕士研究生, 研究方向为网络安全。
收稿日期:2017-06-02
Study on the Index of Determining the Optimal Clustering Number of K-means Algorithm
GUO Jing HOU Su
College of Information Technology work Security, People's Public Security University of China;
Abstract:
Cluster analysis is widely used in the field of business intelligence, image pattern recognition, Web search, biology, is an unsupervised observational , most clustering algorithms are faced with a very difficult problem—to determine the optimal number of -means is a typical partition-based clustering method, which requires users to input the number of clusters K, but this is usually very difficult, and the determination of the number of clusters is a key factor in the quality of are many cluste