1 / 107
文档名称:

数据挖掘中聚类算法研究与仿真.pdf

格式:pdf   页数:107页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

数据挖掘中聚类算法研究与仿真.pdf

上传人:cherry 2014/5/16 文件大小:0 KB

下载得到文件列表

数据挖掘中聚类算法研究与仿真.pdf

文档介绍

文档介绍:北京邮电大学
博士学位论文
数据挖掘中聚类算法研究与仿真
姓名:赵艳厂
申请学位级别:博士
专业:电路与系统
指导教师:宋俊德
20030401
摘要近年来,数据挖掘在很多行业得到了越来越广泛的应用,如序列模式分析、客户分类与聚类、交叉销售、甄别欺诈行为等。聚类,作为数据挖掘中的为了解决高维海量数据的聚类分析问题和数据流聚类问题,本论文设计了一系列新的聚类算法:等密度线聚类算法、基于网格的等密度线聚算法、以及高维聚类通用框架模型。其中,挖掘在电信计费数据分析中的应用进行了尝试和探索。惴╗度聚类和基于网格聚类两者各自的优点,该算法利用网格和邻居的思想来减少计算的复杂度,从而实现快速的聚类。该算法的有效性通过主要方法之一,也受到越来越多的关注。目前已经有很多比较成熟的聚类算法,如甿、甿、等。虽然其中有些算法已经得到成功应用,但是,聚类分析也面临着越来越多的新问题。如海量数据的处理、商维数据的聚类、子空间聚类、带有约束条件的聚类、数据流聚类等。针对这些新问题,很多人在不断研究新的算法,也有人在以前算法的基础上不断地进行改进。类算法、惴ā⒂糜诓煌芏染劾嗟亩嘟锥嗡惴ā⒂糜谑流聚类的法通过结合密度型聚类和网格型聚类两者的长处,能够有效地用于高维海量数据的聚类分析,并具有很好的时间复杂度和空间复杂度。此外,本论文还提出本论文的主要贡献有以下几点:岷匣诿芏染劾嗟乃枷耄岢隽说让芏认呔劾:惴ā尽蚌辍薄8盟惴ɡ玫乩硌е械雀呦叩思想,把该思想与密度聚类相结合,能够识别任意复杂形状的聚类,并且能够有效排除噪声的干扰。此外,聚类的结果不受数据输入顺序的影响。该算法的思想和有效性经过了实验验证,并发表于《北京邮电大学学报》。岷匣谕窬劾嗟乃枷耄岢隽嘶谕竦牡让芏认呔劾:Mü岷匣诿实验进行了验证。其具体思想发表于ü粤诰佣ㄒ搴屯竦ピ4娲⒎椒ǖ母慕岢隽薃,即改进的算法惴ā緕А8盟惴ㄖ谢共捎昧烁玫姆指罘椒ㄒ约案玫淖了数据挖掘与数据仓库、等技术在电信行业应用的建议方案,并对数据国际会议。《数据挖掘中聚类髯ㄑ芯俊仿真》.瓺—阱宦垡
洳参数确定方法,使之能够很好的艨用于海量耐维数据集的聚炎分丰肝。本论文对算法的复杂艘进行了分析和推导,弗通过把该算法成用予静静复杂形状数据榘,诞稿了算法黪瘫牲戆露鸯效牲。该冀滚发表毽际会议。攵允菁懈鞲鼍劾嗟姆骤烀芏炔簧镜奶氐悖蝳:了用于不嗣密度鞭溅藤疑羧键集中分毒密瘦不霜甚囊蘧髯较大蕊各个聚类。零论文逶过实验证明了簿法的有效憔。该算法的飙体思想发寝。】二《北京邮电大V佣远炝鬈蔡氐悖旯禛惴ň裁底蹋蒎伊薕原始数据集,从而保证了谯有限的空间条件下能够对连续的二维数据浚逶嚣离速蒙炎。零沦文遴过复杂鏖分摄鞫实验验谖了其有效瞧。滚算法已揆稿蒸《电子攀擞》。攵愿呶菘占渲惺莘植嫉奶氐悖岢隽烁哐佩逵镁劾喔忾媚P‘!俊5拦岩桓鲦瘴衫喙谭职晡6喔鲆晃蛳喙程,胰瑟楚蒋遴鼹低维聚炎簿法麓够寄效地蘑予惑绻数据集的蘩类。论文中通过实验验证了该模型的有效性。该框架模型思想发袭于兴键诿:数据挖蘧,豢炎,无整罄警嚣,嵩维,数摅滚凝类的凝类算法。。通避多个殓段垂冬巢类,该算法熊够识学学报》。算法‘。,来实现对萘鞯木劾唷e灞芟岽碚4国际会议。篜麟槐《数撼挖粥中浆类算法拼抛’螺健
逝钆癖けβ舐趟芸悍燠茎豪俭媳ぼ珼,猙,,,琈—¨。,—琩,,猻,琫,,,琺瑂琸—珺,,,,.,—,,琧琫.,.,—.,,琣瓵甀瓸,—.。,瓵
—‘数摧挖掘中梨类算法究‘抡妗瑆甇琣瓸瓸.,.琣猟.,,:,,,—琩搏貉宦凼,瓵琲’猳.
第一章引言隧静,数据稼掘广泛箍应用于许多领域。在黛耪医学领域,数攒挖瓣掰予业,数摄挖掘用于销售活动的有效性分析、客户保塑、购买推荐和交叉销售别、数据分椽、黧像处璞、枣场礴究等。在藩韭壤域,浆类瑶戳帮韵寿汤入员从客户数据库中发现不同的客户群体,并根据购买特征找出每个群体的特点。在生物学中,聚类冒颤用于筏掰植物釉动物的分黉法,穰雍功能对鏊因进行分类。浆类还可以用于从地球观测数据库中识别相似的土地使用区域,根据房屋的特点等。此外,还可以用作其他数据挖掘算法的预处理阶段。度型聚类算法、圈格型聚类算法。霞藏已经有很多眈较成熟的聚类算法,魏算法已经得到成功应用,但是,聚类分析也面临着越来麒多的新问题。如海量数据黪处理、高维数据的聚类、予空阀聚类、带鸯约束象5木劾唷⑹萘骶类等。针对遮些新问题,很多人在不断研究新的算法,也有人在以前算法的基为了解决商维海量数据的聚类分析问题和数据流聚类问题,本论文设计了一组新的聚类算法:等密度线浆类算法篏産⒒谕癖5让芏认呔劾嗨惴:.惴āMü岷厦芏刃途劾嗪聚类分析,并具有很好的时间复杂度和空间复杂度。通过对算法进~步蛄心J降姆治觯辉谝鴍亍和盒融领域,数搬挖掘用于贷款支付预测、客,々信阚策略分析、客户分类与聚类、洗钱