文档介绍:基于粗糙集的聚类算法及应用研究摘要随着信息时代的来临,各行各业的繁荣与发展都离不开知识发现。知识库中数据规模的不断扩大,从海量的数据中萃取出其中隐藏或潜在的知识和规则是对未来的决策十分重要的。本文主要研究聚类算法。聚类算法是一种无监督的学习算法,目的就是把所给的数据元素划分到相似的数据分组之中,这个数据分组就叫做簇。本文主要研究粗糙集与聚类算法之间结合而产生的粗糙聚类算法。采用甈淌岢龅墓赜诖植诩条基本性质,对一种划分的聚类算法——算法进行改进得到粗糙的劾嗨惴ā6员甃教授提出的粗糙甿算法而言减少了两个初始参数。并且进行试验得到了较好的实验结果。本文对岢龅亩曰旌闲允萁芯劾嗟腒算法、进行改进,得到一种新的处理混合型数据的甿聚类算法。并且通过萁惺匝椋玫浇虾玫氖笛榻峁最后本文为了试验需要设计了一种基于疭构架的聚类算法系统。集成了甿,。并用语言进行编程,采用械腎魑S没Ы缑娑韵低辰胁僮鳌J褂魑:筇ㄊ菘狻关键字:数据挖掘粗糙集聚类模糊聚类
篸瑀甌甃甌瑄瓹—瑃甀瑃瓹猰瑆猟瑃猟甌疭甌琣籸,,,—.甈瑃,琣..,.籧籸Ⅱ
⋯一:寻嘏⋯一:≥蓖⋯心赳睹甓嘣缕鼓倘多月坪日口弦囵甸时发布广西大学学位论文原创性声明和使用授权说明学位论文使用授权说明原创性声明本人声明:所呈交的学位论文是在导师指导下完成的,研究工作所取得的成果和相关知识产权属广西大学所有,本人保证不以其它单位为第一署名单位发表或使用本论文的研究内容。除已注明部分外,论文中不包含其他人已经发表过的研究成果,也不包含本人为获得其它学位而使用过的内容。对本文的研究工作提供过重要帮助的个人和集本人完全了解广西大学关于收集、保存、使用学位论文的规定,即:按照学校要求提交学位论文的印刷本和电子版本:学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的的前提下,学校可以公布论文的部分或全部内容。C苈畚男枳⒚鳎⒃诮饷芎笞袷卮斯娑体,均已在论文中明确说明并致谢。请选择发布时间:口解密后发布
第滦髀论文的选题意义及研究背景随着数据库技术的发展和广泛应用,数据库已经被越来越多的企业、科研机构、政府部门所应用和重视,都各自建立起相应的信息管理系统和数据库,为各个领域积累了大量的原始数据。随着网络的进一步普及,进而出现了海量数据库。从大量已经存在的数据中发掘对将来决策有用的规则和知识成为当今研究的热点问题,这样就产生了数据挖掘这个学科。数据挖掘即从数据库中发现知识飧龈拍钭钤缡月在美国底特律市召开的第十一届国际联合人工智能学术会议上正式形成的。年在加拿大召开了第一届知识发现和数据挖掘国际学术会议上,由于把数据库中的“数据”形象地比喻成矿床,“数据挖掘”一词很快流传开来【。近年来,随着在全球范围的迅速普及和应用,网络日益成为人们生活、工作的重要组成部分。据估计,网络己经发展成为拥有谝趁娴姆植际叫畔⒖占洌艺庑┬畔⑷砸悦到鲈略龀ひ槐兜乃俣增加T谡庑┐罅俊⒉煌母骼郬信息数据中,蕴含着巨大潜在价值的信息,如何快速、有效地发现这些信息资源已成为急待解决的问题。目前,数据挖掘成为了人们研究的热门课题之一。数据挖掘对各个部门决策人做出正确的决策起了相当重要的辅助作用。人们对未来事物的判断与预测也越来越依赖于数据挖掘。数据挖掘成为了一个有聚类算法作为数据挖掘的一个有效手段,已经被广泛的应用于银行业、医疗信息挖掘、生物信息挖掘等领域。由于对先天信息缺失的数据处理问题十分复杂,许多方法无法解决这类的问题,聚类算法为这个问题提供了一个有效的途径【俊>劾嗨惴ǖ拇匆庥提出都可以很好的解决这类问题,使得到的结果合理、有效。现在人们认识事物的概念已经由原来确定的变为不确定的,即:边界模糊的。所以基于模糊集和粗糙集的模糊聚类算法成为了当今研究的热点问题。模糊聚类算法在处理大规模数据集问题和掘方面有其现实意义。粗糙集作为一种新兴的数据挖掘工具有其自身的优点和独特的处理不确定性问题的思想【。成为了一种解决模糊不确定性问题的有力工具。而粗糙集在处理问题时相对于模糊集而言,对不确定性问题的描述更加客观:其定义不确定性知识无需任何数据集本身外的任何信息。结合了粗糙集的聚类分析的结果也由原来的边界明效并且有力的决策手段。于毒鰐囊,的,嗨惴╝■屯用研完
国内外研究的现状和存在问题确的簇,变为了边界模糊的簇。在聚类分析中,因为许多数据点的特征不明确,使得将它划分到任何一个确定的簇中都是不合理的,而一些边界模糊的簇正好符合数据集的这种几何特征。这样使得粗糙聚类成为了一个新的研究聚类算法的切入点【。目前基于粗糙集的聚类分析成为了一条研究数据挖掘算法的新方向,粗糙聚类分析的研究又有着理论意义。本文主要研究粗糙集和聚类分析算法的结合和应用。粗糙集理论在聚类分析中的应用