文档介绍:北京交通大学
硕士学位论文
可扩展的数据挖掘可视化系统的研究与设计
姓名:孔令伟
申请学位级别:硕士
专业:计算机应用技术
指导教师:胡俊
20050301
摘要随着计算机技术的飞速发展,数据量急速膨胀,用传统信息管理方法越发难以满足业务发展的需求。数据挖掘是一门将人类的探索能力和计算机的强大处理能力结合在一起,发掘海量数据背后隐藏的知识的新兴技术。可视化是一门涉及计算机图形学、图像处理、计算机辅助设计、计算机机交互技术等多个挖掘的多维数据可文在综合研究各种数据可视化方法和多种数据挖掘方法的特多个数据挖掘系统的基础上,设计并搭建了可视化数据挖掘平统框,并且从不同的角度实现了多个进行数据挖掘可视化操作模块,取得了较好的实践效果。对目前国际上现有的多维数据可视化技术进行了详细研究及综合比较。攵越锌墒踊萃诰虿僮鞯男枨螅杓撇⑹迪至私锌视化挖掘操作的平台。具有如下功能和特点:δ芤桌┱剐院涂膳渲菩裕褐骺蚣苡氩煌目墒踊?榧湎嗷独立,可采用配置文件描述的方式为系统添加新建立的模块:定统一的接口标准:各个功能模块通过统一的接口加入到主台的系视觉、用户界面方法学、系统设计、领域的新兴交叉学科。而应用于大型视化技术更是最近几年开始研究的信号处理及人数据集探索与个领域,拥有应用前景。文的研究工作主要有以下几个方面:系统中,并与主框架建立联系:广阔的的功能本点以及太摘要
橄蟪鍪萃诰蚩墒踊璧幕啵菏菇⒐δ苣?楦臃奖直接:允莶僮鹘型骋淮怼攵允萃诰蚍椒ǖ牟煌矫妫芯慷嘀质萃诰蚍椒ú⑼成了如下几个可视化数据挖掘模块:闷叫凶杲惺菹允捎没诎瞬媸骷际醯目墒踊椒攵怨亓7治鲋蠪增长方法,对一树进行可视化攵苑掷嗉际酰苑掷嗍鹘锌墒踊⑻峁┝私薪换ナ分类的支持。北京交通大学硕士学位论文关键词数据挖掘,可视化,数据可视化技术,平行坐标,八叉树,分类树Ⅱ
垒堕坚!.,,瑃珻.’.,,,瓾·甌::瓵.
北京交通大学硕十学位论文琽琧,..瓵—.—;:琾.;
第一章可视化技术概述可视化技术的重要意义视觉信息是人类最主要的信息来源,医学和心理学研究表明,人胞与视觉相连。因此,为了充分利用人类的视觉潜能和脑功能,在二十世纪年代末提出了一项新的技术一可视化技术,这项技术一经提出就得到迅速发展。所谓“可视化”就是将数据、程序、复杂系统的结构及动态行为给予图形、图像、动画等可视化的形式表示。可视化是一门涉及计算机图形学、图像处理、计算机辅助设计、计算机视觉、用户界面方法学、系统设计、信号处理及人机交互技术等多个领计算机用于科学计算和数据处理已经有多年的历史,但是,长期以来,由于计算机水平的限制,对数据主要只能进行批量处理,不能进行交互处理,更不能对计算机过程进行干预和引导,只能被动地等待计算结果的输出。而大量的数据输出也只能采取人工方式,或者使用绘图仪输出二维图形。这种方式不仅不能得到有关数据的直观、形象的整体概念,还可能丢失大量信息。随着科学研究领域的不断扩大,在超级计算机、飞行器、气象、医学和探矿等领域产生了大量的数据。但由于缺乏有效的分析手段,常常不得不割舍庞大数据群类日常生活中接受的信息%来自于视觉信息,而%的脑神经细域的新兴交叉学科。可视化技术概述
中的大部分有用数据,导致应有的信息处理精度降低。海量数据的产生己不能有效地解释这些数据的矛盾日益尖锐。因而,迫切要求提供一种能处理和解释这些海量数据的技术,科学计算可视化就是顺应这可视化技术的最早提出源于科学计算可视化年代后期提出并发展起来的一个新的研究领域。它正式出现于年旅拦铱蒲Щ鸹嵴倏5囊桓鲅刑只嵘稀F淙挝裰荚诮ḿ扑机进行的大规模科学こ计算结果及其产生的庞大而令人~时难以理解的数据信息转换成计算机图形、图像信息,加以静态或动态显示,从而得到有关计算结果的直观整体概念,以便及时和正确地理解、把握科学工程计算中的各种现象和结果。从年起,美国计算机学会计算机图形学技术委员会开始一年一度地举办可视化国际学术会议,这标志着“科学计算可视化”作为一个学科己经成熟,它的应用遍及所有应用计算机从事计算的科学和工程学科,并获得巨大所谓“科学计算可视化”,就是应用计算机图形学和图像处理技术,将科学计算过程中产生的数据及结果数据,转换为人们容易理解的图形图像形式,在屏幕上显示出来。科学计算可视化把科学计算过程中的数据及结果转变成人的视觉可以感受到的计算机图像,这些图像可以将大量的抽象信息有机的组织在一起,并形象生动地显示数据所表示的内容及其之间的关系,从而使许多抽象的、难于理解的原理和规律变得直观简单,许多繁冗而枯燥的数据变得生动有趣。虺苬的提出。它是发达国家在二十世纪一要求而产生的。效益。北京交通大学硕士学位论文
可视化技术的特点实现科学计算可视化具有多方面的重要意义。它可以大大加快数据的处理速度,使目前每日每时都在产生的