1 / 17
文档名称:

数据挖掘系统设计.doc

格式:doc   大小:159KB   页数:17页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘系统设计.doc

上传人:buhouhui915 2017/11/24 文件大小:159 KB

下载得到文件列表

数据挖掘系统设计.doc

相关文档

文档介绍

文档介绍:数据挖掘
实<br****br/>报

题目: 数据挖掘系统设计
院系: 商学院
学号: 20098311
学生姓名: 周利军
指导教师: 彭卫
日期:2011/12/19
数据挖掘系统设计
1系统开发目的及背景
随着科学技术的发展,信息时代的来临,可以说我们正处在一个信息大爆炸的时代,我们的生活时时刻刻都被信息笼罩着。我们随时也都在使用数据,当然也在产生数据,但是我们如何更好地使用数据,从看似无用的巨大数据中挖掘出有用的知识或者规律,为我们做出一些目标的规划或设计时提供科学的支持?为初步解决这个问题,我们的系统应运而生!
在这个时代,最优化问题已经渗透到管理、经济和工程技术等领域的各个方面。现代科学技术特别是计算机技术的迅速发展,为求解最优化问题提供了雄厚的基础和有效地手段。因此,最优化技术具有十分重要的现实意义。
随着数据的不断使用,数值分析就愈发的显出其重要性。数值分析是科学计算的重要基础之一,承担着引导计算科学入门到详细介绍常用的现代科学计算的优化算法,为我们能快速高效的使用庞大的数据提供了科学的方法。
近年来,网络的快速发展与普及,使人类开始真正体会到了数据海洋的无边无际,也将人们陷入了一个“数据丰富,知识匮乏”的尴尬境地。面对如此巨大的数据资源,人们迫切需要新的数据分析方法和技术,以便能够利用信息技术发展的新成果,将这些巨大的数据资源转化成有价值的信息和知识,为我们制定科学的决策提供支持。
2项目计划任务
用Matlab数学平台开发一个数据挖掘系统主要功能如下:
a).最优化——包括一些常用的最优化方法的程序实现,使一些实际问题分析求解的过程过程功能化,求解简单化,求解结果精确化。
b).数值计算——包括一些重要的典型算法的功能程序化,界面化,使一些大型的数据分析及功能运算模式化,机器化。
c).数据挖掘——包括一些重要的分类方法的程序实现,便于使用者对巨大的数据具有初步的处理和挖掘,为其科学决策提供支持。
3系统设计思路
本系统的设计思路与其他系统开发的思路相同,采用模块化的思路来实现系统各个不同的功能,最后通过模块之间的耦合,来完成系统的整体开发。
本系统分为三个模块,在不同的模块下耦合了一些子模块:
4系统设计流程

首先要有一个总体的规划,即概要设计。概要设计需要对软件的设计进行考虑,包括系统的基本处理流程、系统的组织结构、模块划分、功能分配、接口设计、运行设计、数据结构设计和出错处理设计等,为软件的详细设计提供基础。

在概要设计的基础上,需要进行软件系统的详细设计。在详细设计中,描述实现具体模块所涉及到的主要算法、数据结构、类的层次结构及调用关系,需要说明软件系统各个层次中的每一个程序(每个模块或子程序)的设计考虑,以便进行编码和测试。应当保证软件的需求完全分配给整个软件。详细设计应当足够详细,能够根据详细设计报告进行编码。

在系统编码阶段,根据系统详细设计中对数据结构、算法分析和模块实现等方面的设计要求,开始具体的编写程序工作,分别实现各模块的功能,从而实现对目标系统的功能、性能、接口、界面等方面的要求。

在编码的基础上,根据各个子系统的特性通过几口设计将各个模块耦合在一起,形成最原始的挖掘系统,在设计接口的过程中要做到高内聚低耦合,有利于下一步的系统测试及相关问题的的解决。

根据设计初衷,对系统各个功能进行测试,发现问题并解决问题,在测试过程中要做到黑盒和白盒测试法的交互进行,相关程序编码人员辅助进行尽量做到用户界面友好性。在此过程中如发现一些与设计初衷有出入,权衡系统的健壮性与实用性,或修改设计方案,或作适当取舍。
5部分模块算法分析与设计
Apriori算法


源程序见附录。
K—means算法

A).类(簇)的定义表示
B). 距离的定义