1 / 56
文档名称:

基于数据挖掘的数据可视化系统的设计与实现.pdf

格式:pdf   页数:56
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于数据挖掘的数据可视化系统的设计与实现.pdf

上传人:peach1 2014/3/3 文件大小:0 KB

下载得到文件列表

基于数据挖掘的数据可视化系统的设计与实现.pdf

文档介绍

文档介绍:评阅人:童晓棒宋宕萋学位论‘文基于数据挖掘的数据可视化系统的设计与实现答辩委员会主席:三尺疗分类号密级作者姓名:姜安琦指导教师:申德荣教授申请学位级别:学科专业名称:论文提交日期:学位授予日期:东北大学计算机软件与理论研究所硕士学科类别:工学计算机软件与理论年论文答辩日期:年东北大学
要摘基于数据挖掘的数据可视化系统的设计与实现本文讨论了一个基于际醯氖萃裣低场!狤狦校萃诰蚝褪东北大学硕士学位论文近十年来,计算机网络迅猛发展,同时网络的使用也逐渐增加,信息的数量、种类和分布都达到了一种“爆炸式”的增长,如何存储、分发、组织和管理、高性能处理、分析和挖掘海量分布数据成为许多应用的首要问题。数据网格技术的发展为解决这个问题提供了一条有效的技术途径,它通过开发能够集成网络上分栉的多个数掘集等资源,形成单一虚拟的数据访问、管理和处理环境,为用户屏蔽底层异构的物理资源,建立分布海量数据的一体化数据访问、存储、传输、管理与服务架构。但随着科学技术的不断进步,人们所处理的数据量越来越大,应用数据从几卜个到,而且还在持续高速的增长。如何准确、快速地对数据的分布规律和变化趋势进行分析成了一个急待解决的问题。为了解决这个问题,数据网格中提供了对数据进行数据挖掘和数据可视化的功能模块,以方便用户对海量数据进行整理和分析,并对数据的分布和发展趋势的预测提供科学的依据。丁视化模块的设计和实现。首先,本文对—系统的结构进行了分析。然后,通过比较几种不同的数据挖掘工具在各方面的特性,确定在实现数据挖掘和数据可视化模块的过程中所需要选择的数据挖掘工具。并且重点讨论了开发基于数据挖掘功能的数据可视化模块的过程。实现了黄骄劾嗨惴ê虵关联规则算法,并将通过这两种算法进行数据挖掘后的显示给用户。在此基础上,通过分析了整个性能测试的测试结果,总结归纳了影响一篔性能的几点因素。并对数据挖掘和数据可视化模块部分的性能改进,提出了几点发想。要是将数据挖掘与数据可视化模块的部署与系统的峁菇岷掀鹄矗ḿ性诿户服务器端的数据挖掘和数据可视化功能分散到底层的多个节点¨约跚服务器的负担,进一步提高系统的性能。通过实际验证,本文所提出的数据网格环境下,基于数据挖掘技术的数掘可视化模块的开发是可行的,并达到了预期的目标。关键词:数据挖掘:数据可视化;.算法;技术摘要
琺琣一一—,,瓸东北大学硕士学位论文甅,,詁髓瓼,琲,—甌,。,,,..琺...瑃.
甌瑃东北大学硕士学位论文琣現猤瑃—..,琂..
学位论文作者签名:萎密筠独创性声明学位论文版权使用授权书悖日本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示诩文的复印件和磁盘,允许论文被查阅和借阅。本人授权东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。意。日期:本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论缱髡吆偷际ν馔辖涣鳎朐谙路角┟环裨蚴游2煌狻学位论文作者签名:签字日期:导师签名:签字:
⒄瓜肿网格是国家级高性能计算和信息服务的战略性基础设施,它的目标是将地理上分布异构的各种高性能计算机、数据服务器、大型检索存健系统和可视化虚拟现实系统等,通过高速互连网络连接并集成起来,共同完成一些缺乏有效研究办法的熏大应用研究问题。它不仅实现了对各种计算资源的访问,而且实现了对所有数据资源的统⋯访问。数据网格是以网格的基本功能为基础的。它的核心是元数据管理和存储资源管理,通过元数据目录将异构的各种资源和各种服务有机地结合起来。存储资源代理有效管理异构的各种存储资源。数据网格与传统的分布式数据库的区别在于:传统的分布式数据库功能仅限于对物理上分布的数据集成起来将集成后的结果返回给用户:而在数据网格系统中,数据集成仅仅是数据网格要完成的功能之一,在进行数据集成完成后,数据网格还应该刑‘集成后的结果进行相应的处理,找出隐藏数据集中的关系,为用户的分析和预测提供依据。,为世界范围内分布的科研团体提供的数据分布存储、传输和计算密集型分析处理的能力,以进行科学研究,开展面向高能物理学、地球观测、生物信息学等应用的研究工作,研究内容主要包括;数据访问、数据副本管理、元数据管理、数据安全、查询优化、资源调度和管理等,采用、面向对象数据库、嘲格数据库服务系统等技术,构建一个包括软硬件的网格环境。】是其数据库访问接口的氖迪郑琌谔致弁窈褪菘庀低常乇鹗橇0钍