文档介绍:基于可拓聚类方法的数据挖掘研究摘要了,很多数据信息被运用于商务决策、市场分析、科学研究和工程项目的开发等,规模和范围的不断扩大,使得人们能够获得的数据量也越来越大了,数据的种类也变得日渐繁多。特别是互联网的快速发展发展为我们带来大量的数据和信息,现今世界急切需要解决的一个重要问题。在这种情况下对于数据挖掘及其方法的本文研究的问题是属于可拓工程和数据挖掘方面的。在借鉴和综合国内外前的基础上,将可拓学的理论知识引入到了数据挖掘中去,从可拓学研究的基本思数为核心的可拓聚类方法。该方法以物元为基础,将知识定义为物元,首先将知识以物元的形式模型化,形成进行数据挖掘的最初知识模板,然后用要分析的数据信息形成可拓集合,确定物元分析的经典域和节域,最后建立解决问题所需要的关联函数,用关联函数值的大小来判断待分析的知识信息属于某集合的程度,从而进行聚类。本文所做的研究工作主要包括以下几个方面:冉舷昃〉芈凼隽四壳肮谕舛允萃诰蛳喙乩砺奂捌溆τ醚芯康淖体情况,包括数据挖掘的概况、挖掘数据的特点、数据挖掘的过程、挖掘中常用允萃诰蛑械木劾喾治龇椒ń辛吮冉仙钊氲难芯浚ň劾喾治龈述、常用的五种聚类方法的内容、优点、缺点和几种主要聚类算法的描述,同时目前,人们使用计算机网络等高级技术发现数据信息的能力比以前大大提高这一趋势将得到持续发展。现代社会的信息等技术的高速发展以及数据库应用的面对这么大规模的、而且存在着异常数据的数据库信息,如何从其中提取出隐含的、有用的、对商业等的决策有用的信息或知识,进一步提高信息利用率,成为研究就变得极为重要了。本文就是基于这一点,在对数据挖掘的方法及其算法分析研究的基础上提出一种新的可拓聚类方法。人的相关研究成果的基础上,在分析研究了目前数据挖掘理论基础及其聚类方法想、工具和方法出发,将问题进行了形式化的描述,建立了以可拓集合和关联函的几种方法以及在科学研究、金融业、医疗等领域的应用。对其从时间复杂度、目标数据属性、发现聚类形状、对噪声数据的敏感性、对数
据输入顺序的敏感性、高维性和算法效率鲂阅芙辛吮冉稀凼隽私⒖赏鼐劾喾椒ㄖ兴褂玫目赏匮Х矫娴睦砺邸⒍ㄒ搴凸剑型的一般过程,并对其具体内容进行了详细的描述:最后以具体的数据为基础,通过地震分类识别实例研究对验证了可拓聚类方法模型的有效性。关键词:数据挖掘;聚类分析;关联函数:可拓集合;可拓学;物元包括基于理论、可拓集合论和关联函数;在此基础上提出了建立可拓聚类方法模
.砥,,,砀.,瓼吼,,,,瑃琩瑃,,,甀琣:
岫;;琾,琣,琺,,琣,,,,琲;.:;.
多桃杏饬签字日期:叫年多月学位论文作者签名:癔快签字日期:饶甓嘣陆年独创学位论文版权使用授权书声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的他人已经发表或撰写过的研究成果,也不包含未获得ⅲ唬嬉胖被恳媛妆鹱耸嚎够ブ稀莼蚱渌逃沟难换蛑な槭授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息众提供信息服务。C艿难宦畚脑诮饷芎笫视帽臼谌ㄊ研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公学位论文作者签名:导师签字:签字日
提出了一种新的方法一可拓聚类方法。该方法以物元为基础,将知识定义为物随着计算机技术的发展,各行各业都开始采用计算机及相应的信息技术进行究。世纪年代初,以蔡文教授为首的我国学者们创立了一门新学科——可局管理和运营,这使得企业生成、收集、存贮和处理数据的能力大大提高,数据量也与日俱增。此外,互联网的发展更是为我们带来了海量的数据和信息。但存储在各种数据媒介中的海量的数据,在缺乏强有力的工具的情况下,已经远远的超出了人的理解和概括的能力。在这样的背景下,人们迫切需要新一代的计算技术和工具来开采数据库中蕴藏的宝藏,使其成为有用的知识。另一方面,近十余年来,计算机和信息技术也有了长足的进展,产生了许多新概念和新技术,如更高性能的计算机和操作系统、因特网、数据仓库、神经网络等等。在市场需求和技术基础这两个因素都具备的环境下,对数据挖掘技术的研究就显得尤为重要了。目前国内外许多学者对这个领域的研究已经投入了很大的力量。但是,在数据挖掘的基础理论基础及其算法方面的研究还不成熟,还有待于人们去进行研拓学。可拓学的发展应用为数据挖掘提供了更加新颖的思路和途径。可拓学的基本逻辑细胞是物元,它将现实事物