文档介绍:兰州理工大学
硕士学位论文
基于量子机制的分类属性数据聚类算法研究
姓名:赵正天
申请学位级别:硕士
专业:控制理论与控制工程
指导教师:李炜;赵小强
20090504
度步长以,和紧致。燃,提出惴ǎ⒎直鹪谙咝钥煞质菁拖咝圆摘要数据挖掘技术是近年来国际上在信息决策领域较为活跃的研究方向之一。作为数据挖掘的一种有力分析工具,聚类分析得到了人们的广泛关注。在众多待聚类的数据类型中,分类属性数据是常见的一类,其属性值是有限无序的,且不可比较大小。由于分类属性数据对象分布固有的无序性,使得仅有少数几种算法能实现对其聚类,但这些算法或多或少地存在不稳定、随机性差等缺点。因此,积极探索更新、更有效的分类属性数据聚类算法依然是聚类研究的一个重要组成部分。鉴于此,本文在深入研究现有惴ǖ幕∩希攵云浯嬖诘奈侍猓饕=辛艘韵工作:攵訡算法由于采用传统的嘁煨远攘坎舛燃扑闶荻韵蠹湎嘁性,忽略了分类属性取值自身的涵义以及取值之间的特征关联,从而导致惴ň劾能力受限问题,通过引入一种新的分类属性数据嘁煨远攘坎舛龋岢隽艘恢指进的算法,并分别对分类属性、二值属性和混合属性数据集进行了仿真研究,结果表明改进后的算法具有更高的聚类准确率。攵訡算法聚类效果对聚类度量尺度∥较敏感,而∥的确定无通用原则,可操作性差,以及惴ǘ韵咝圆豢煞值氖莶荒茏嘈У任侍猓ü刖劾喽攘砍可分数据集中进行了仿真验证。实验结果表明,算法在准确性、鲁棒性上较算法均有提高。攵訡算法和算法不能自动、准确地确定聚类最佳类别数,在聚类有效性方面存在欠缺的问题,通过定义一种以紧致性指标疉屠肷⑿灾副闍基础的聚类有效性函数岷喜愦文鄣乃枷耄岢隽薈惴ǎ⒁苑抡媸例验证了:聚类有效性函数呛侠淼模籆惴ú唤鼍哂懈叩木劾嘧既仿识且能够准确地检测出最佳类别数,是有效可行的。关键词:数据挖掘;聚类分析;分类属性数据;相异性度量测度:聚类度量尺度步长;聚类有效性皇曼曼曼曼曼曼蔓皇曼皇曼曼曼曼曼曼曼曼曼曼皇曼皇曼曼鼍皇曼皇曼曼量鼍硕士学位论文量曼皇曼舅曼曼曼曼曼曼曼曼皇曼曼曼曼曼曼曼曼鼍曼量况Ⅲ,
.一量皇曼曼鼍皇曼舅隺篸;,;基于量子机制的分类属性数据聚类算法研究瓵琩..,.疉甌..,;琩瓵,..琣,.琣琣,.;韭灰唬甀
关于大豆疾病数据的聚类度量尺度步长‰与聚类准确率墓叵怠插图索引图关于动物园数据的聚类度量尺度步长名刖劾嘧既仿蔣的关系⋯⋯⋯⋯⋯⋯⋯·皇曼曼事韭皇曼舅皇皇曼皇曼皇曼皇舅曼皇曼皇曼曼曼曼曼曼皇事曼曼曼曼皇曼皇曼曼鼍硕士学位论文皇曼曼曼曼曼蔓曼曼皇事事曼曼曼曼曼量图大豆疾病数据集的肜啾鹗齝关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..图动物园数据集的肜啾鹗齝关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.
附表索引基于最子机制的分类属性数据聚类算法研究表数据集⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..算法的实验样本数据集⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表对大豆疾病数据聚类结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表对国会投票数据聚类结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..表对人造样本数据聚类结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..算法的实验样本数据集⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...算法对动物园数据聚类结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...表大豆疾病数据聚类结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..算法对动物园数据聚类结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..
导师签名:专必尹作者签名:南欹、日期:研年∥月/日期:砷年多月/日作者签名:锰日期:硼甓嘣拢兰州理工大学学位论文原创性声明和使用授权说明原创性声明学位论文版权使用授权书本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权兰州理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。
第滦髀研究背景及意义近十几年来,随着计算机、通信技术的普及和大规模的际跤τ茫死嗌生活的几乎所有领域都积累了十分丰富的数据,互联网的飞速发展更是加快了数据增长的步伐。然而,这些数据中所蕴藏的