文档介绍:第 卷 第 期 新 余 学 院 学 报 ...
年 月 .
一 种基于密度的增量 — 聚类算法研究
● 司福 明
安徽机电职业技术学院 信息工程系, 安徽 芜湖
摘 要 :针对传 统聚类算法无法有 效 处理 高维 混合属 性数 据 集的 问题 ,对 原有 的数据 归一 化 方法进 行 改进。在 —
和 聚类算法的基础之上 ,结合增量 聚类的思想和数 据之 间相异度 的计算 方法 ,提 出了一种基 于密度 的
增量 — 聚 类算法。该算法能有效处理具有 高维混合属性的数据集 ,在 准确度和效 率方面都得到提 高。
关键词 :基于密度 ;— 聚类算法 ;数 据相 异度
中图分类号 : 文献标识码 : 文章编号 :— — —
以提高聚类算 法 的准确度 为 目标 ,在分析 — 于 大规模 数据集 的并 行 聚类挖 掘 的优点 。
和 聚类算法的基本思想 以及各 自优 — 缺点也很 明显 :需要事先确 定
缺 点 的 基础 之 上 ,提 出 了基 于 密 度 的增 量 — 聚类个数 的大小 。因此 ,— 聚类算法的应
— — , — 用 受到一 定 的 限制 ;个 初 始 聚类 中心 是 随机 选
聚类算法 ,使 — 聚类算法能够有 择 的。由于随机选择 个初 始聚类 中心 ,导致 算法
效处理具有高维混合属性 的数 据集 ,由此改进 了数 对 异 常数 据 敏 感 ,同 时 算 法 运 行 时 间 增 加 ;—
据 相 异度 的计算 方法 。 聚类算法 无法处理 高维混合 属性 数据。—
— 聚类算法和 聚类算法 聚类算法无法有效处理维度大于 的数据集
.— 算法