1 / 3
文档名称:

基于数据抽样的自动k-means聚类算法.pdf

格式:pdf   大小:204KB   页数:3页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

文档介绍:年 月 日 现 代 电子技 术 .
第 卷第 期 ..

基 于数据抽样的 自动 —聚类算法

罗军锋 ,洪丹 丹
西安交通大学 信 息中心 ,陕西 西安

摘 要 :为 了解决传统 算法需要输入值和在超 大规模数 据集进行 聚类的 问题 ,这里在前人研 究基础上 ,首先
在 计算距 离时引入信 息熵 ,在超大规模数据集采用数据抽样 ,抽 取最优样本数 个样本进行 聚类 ,在抽样数据聚类 的基础上进
行有效性指 标的验证 ,并且 获得 算法所 需要 的值 ,然后利 用 引入信 息熵的距 离公 式再在超 大数据集上进行 聚类。 实验表
明 ,该 算 法 解 决 了传 统 算 法输 入 值 的缺 陷 , 通 过 数 据 抽 样 在 不影 响 数 据 聚 类质 量 的 前 题 下 自动 获取 超 大 数 据 集

聚 类 的 值 。
关键词 :算法 ;信 息熵;最优样本抽取 ;有效性 指标
中图分类号 :; 文献标识码 :

点击展开更多

分享好友

预览全文

基于数据抽样的自动k-means聚类算法.pdf

上传人:yinjiong623147 2021/2/28 文件大小:204 KB

下载得到文件列表

基于数据抽样的自动k-means聚类算法.pdf

相关文档