文档介绍:电子科技大学
硕士学位论文
可视化数据挖掘工具的设计与实现
姓名:贺伟淞
申请学位级别:硕士
专业:软件工程
指导教师:陆鑫
20050501
中文摘要学科专业:软件工程论文题目:可视化数据挖掘工具的设计与实现师:陆鑫硬件技术的发展使得目前的计算机系统能存储大量的数据。每年要产生大约,的数据,其中绝大多数是数字形式。数据通常通过传感器、监控器记录。每天的一个简单事务,如信用卡支付、电话使用,都被计算机系统记录下来。由于常常记录了许多参数,导致了高密度的多维数据产生。所有涉及到的区域的数据都被采集,这是因为这些数据是潜在、有价值信息的源泉,而有价值信息可以提供一个竞争优势。然而找出隐藏在这些数据背后的有用信息是很困难的。依靠目前的数据库管理系统,人们只能看到数据的小部分。如果数据以文本方式表达,显示的数据将包含大约鍪菸ǖ蔽颐谴淼数据集包含数百万数据维时这只是大海中的一滴。由于没有可能充分探索采集的海量数据,数据逐渐变得无用,而且数据库渐渐变成数据垃圾场。要让数据挖掘产生效果,很重要的事情就是要把人类包含在数据探索过程中以及把人类的灵活性、创造性、人类总的智慧与目前计算机的巨大存储能力、强大的计算能力结合起来。可视化数据挖掘的目的就是让人类参与数据挖掘过程,让人类洞察目前计算机系统上的大量数据集。可视化数据挖掘的基本思想就是用一些可视化技术形式表达数据,使得人类可以洞察数据、得出结论、直接与数据进于于交互。已经证明,可视化数据挖掘技术在数据分析和探索大型数据库有很高的价值。可视化数据挖掘技术尤其在对数据了解甚少、探索目标模糊的情况下论文首先介绍了可视化数据挖掘工具的研究背景、现状、意义、来源、目标和论文工作,可视化数据挖掘领域内国内外已有的文献综述:接下来,论文介绍了数据挖掘和可视化数据挖掘的基本概念、技术与方法;然后介绍了可视化数据挖掘系统的原型结构,在此基础上设计出可视化数据挖掘系统的架构,进而给出了系统的迪郑⒍韵低辰辛朔抡娌馐院头治觥W詈螅总结了已经完成的工作,对仍然需要解决的问题提出解决方案,提出今后的可副教授硕士生:贺伟凇学号:特别有用。行的研发设想。【关键词】:数据挖掘工具数据可视化可视化技术体系结构导
,:..瑂瑂琣,琣甎琲::疭琽..,,琾..琤瓾,“.琲甐琣甌,甋
./,
签名:堡垒塑导师签名:日期:。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或确的说明并表示谢意。本学位论文作者完全了解电子科技大学有关保留、使用学位论文扫描等复制手段保存、汇编学位论文。C艿难宦畚脑诮饷芎笥ψ袷卮斯娑
言第一章引论文选题选题依据本课题来源于数据挖掘技术的应用研究领域,数据挖掘已经成了网络之后的下一个技术热点,因为大量的数据让我们淹没在信息的海洋中,如何不被数据淹没,在大量的数据“矿石”获取有用知识“金块”,数据挖掘技术应运而兴。以课题基于跨平台语言,研究数据挖掘的可视化表述模型,并完成可视化数据挖掘工具系统的设计与实现。可视化数据挖掘技术是目前国内外研究热点,已有一些国外大公司推出的数据挖掘可视化工具,如是针对通用领域。对于跨平台的应用领域并不一定有效和方便。本课题则是借鉴具的原理模型和实现技术,并在基于跨平台语言的开源数据挖掘工具”基础上完成可视化数据挖掘系统的设计与实现。作为被广泛使用的网络语言,由予其平台独立性、离可用性、安全性、可靠性及其对数据库编程的支持,在金融机构、在线电子商务软件、网络数据库应用和其它关键应用程序的部件中都得到了大量应用。可以用库,而且这样的程序不加修改便可在不同的操作平台上对不同的数据库进行存可视化是帮助业务人员和数据分析人员从业务数据集中发现新的模式和趋势的关键。在发现者和决策者之间进行信息交流,可视化是一种被证明行之有效的方法。在可视化领域,通常有“一图解千言”的讲法。基于以上几个方面的考虑,我选择在平台上开发可视化数据挖掘工具。它通过可视化技术把数据挖掘后的有用信息显示绘用户,并提供一套操作接及商业上突Х治觥⑾墼げ要从数据中“提取利润”的需求;太规模实验数据的分析蚬こ蹋焯宸掷的需求等。它是数据挖掘的研究热点之一。,取5侵饕公司低常琒公司低常幽么驞公司低常琒