1 / 70
文档名称:

基于遗传算法k-means聚类挖掘算法与研究.doc

格式:doc   页数:70页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于遗传算法k-means聚类挖掘算法与研究.doc

上传人:2286107238 2015/6/9 文件大小:0 KB

下载得到文件列表

基于遗传算法k-means聚类挖掘算法与研究.doc

相关文档

文档介绍

文档介绍:基于遗传算法的k-means聚类挖掘算法的研究
摘要
数据挖掘是随着信息技术不断发展而形成的一门新学科,是信息处理和数据库技术领域的一个新兴的研究热点。数据挖掘的任务是从海量数据中发现隐含的有用知识,为科学决策提供支持。
聚类分析是数据挖掘的一个非常重要的研究分支。聚类是一种无监督的分类方法,目标是在没有任何先验知识的情况下,将数据集划分成不同的类,使得相同类中的对象尽可能相似,不同类中的对象尽可能相异。k-means算法作为聚类分析中的经典算法现已被广泛应用在商务、市场分析、生物学、文本分类等领域。然而,k-means算法具有对初始值敏感、易陷入局部极小值等缺点。因此,改进 k-means算法以进一步提高聚类效果具有十分重要的意义。
本文首先详细地介绍了聚类分析技术,对现有的聚类算法进行了分类,分析了这些算法的优缺点,并在此基础上,重点研究了k-means算法。
其次,全面分析了数据挖掘中的一个重要算法——遗传算法。在此基础上,结合k-means算法的思想和特点,提出了一种改进的遗传k-means聚类算法,从编码方法、适应度函数的构造、交叉算子和变异算子的设计、k-means优化操作等方面进行了详细的讨论和分析。
最后,为了测试本文提出的聚类算法的性能,本文用k-means算法和改进的算法进行了三组实验,并对两种算法的聚类结果进行比较,实验结果表明本文算法能够有效地解决聚类问题。
关键词:数据挖掘聚类分析遗传算法 k-means算法改进的遗传k-means算法
RESEARCH OF K-MEANS CLUSTERING IN DATA MINING BASED ON IC ALGORITHM
ABSTRACT
Data mining is a new subject formed with the development of the information technology and is a new research point in the information and database technology. The purpose of data mining is to discovery hidden and useful knowledge from huge amounts of data, which can support the science decision.
Cluster analysis is one of the important themes in data mining. Clustering is a unsupervised classifying method, the goal of clustering is to partition data set into such clusters that objects within a cluster have high similarity parison to one another, but are very dissimilar to objects in other clusters without any prior knowledge. As a classical method of clustering analysis, k-means has been widely used merce, market analysis, biology, text classification and so on. However k-means has two severe defects—sensitive to initial data and easy to get into a local optimum. On this condition, improving k-means is an effective method to get better clustering result.
Firstly, the dissertation detailedly introduce clustering analysis technology, and most existing clustering algorithms are classified, analysis their advantages and disadvantages. On the basis, the dissertation chooses k-means as research target.
Secondly, analyzing an important method—ic algorithm

最近更新

2025年学校民族团结一家亲活动总结 3页

2025年国家电网招聘之公共与行业知识考试题库.. 162页

2025年国家电网招聘之公共与行业知识考试题库.. 160页

2025年国家电网招聘之公共与行业知识考试题库.. 162页

2025年给我一缕阳光初二作文(整理20篇) 27页

销售人员培训心得体会(11篇) 23页

关于幼儿早期阅读教研计划 4页

专题51--勾股定理的多种证明方法(解析版) 1页

2025年国家电网招聘之电网计算机考试题库附完.. 161页

专题10-分式方程及其应用(原卷版) 5页

2025年国家电网招聘之经济学类考试题库带答案.. 80页

2025年国家电网招聘之经济学类考试题库学生专.. 79页

2025年国家电网招聘之通信类考试题库含答案(.. 164页

学术论文体例要求 8页

2025年土地登记代理人之土地登记相关法律知识.. 175页

学前教育专业的职业目标和规划 4页

针刺攒竹、风府穴配合腰部运动治疗急性腰扭伤.. 3页

2025年土地登记代理人之土地登记相关法律知识.. 178页

2025年普法学法知识竞赛题库及答案(最新) 49页

金属聚合物界面结构及其与聚合物太阳能电池性.. 3页

2025年钟大师写人作文范文 1页

2025年机械员考试题库及完整答案(历年真题).. 162页

2025年机械员考试题库【模拟题】 163页

2025年爱迪生传读后感范文 2页

2025年机械员考试题库带答案(完整版) 162页

重型燃机透平叶片热障涂层(TBC)研制和应用 3页

采后茄子冷害防控技术及机理研究 3页

2025年法律常识题库及完整答案(名师系列) 58页

2025年安全文明工地厨房标语 2页

郑州铁路局机车乘务员职业紧张现状及对睡眠质.. 3页