1 / 5
文档名称:

数据挖掘与R语言.doc

格式:doc   大小:30KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘与R语言.doc

上传人:xgs758698 2016/8/4 文件大小:30 KB

下载得到文件列表

数据挖掘与R语言.doc

文档介绍

文档介绍:数据挖掘与 R 语言数据挖掘( Data Mining , DM )又称数据库中的知识发现( Knowledge Discover in Database , KDD ) ,是目前人工智能和数据库领域研究的热点问题, 所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程, 它主要基于人工智能、机器学****模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理, 从中挖掘出潜在的模式, 帮助决策者调整市场策略, 减少风险,做出正确的决策。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术, 主要有数据准备、规律寻找和规律表示 3 个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来; 规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。 R 是用于统计分析、绘图的语言和操作环境。 R 是属于 GNU 系统的一个自由、免费、源代码开放的软件, 它是一个用于统计计算和统计制图的优秀工具。与其说 R 是一种统计软件,还不如说 R 是一种数学计算的环境, 因为 R 并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R 的思想是: 它可以提供一些集成的统计工具, 但更大量的是它提供各种数学计算、统计计算的函数, 从而使使用者能灵活机动的进行数据分析, 甚至创造出符合需要的新的统计计算方法。随着网络、数据库技术的迅速发展以及数据库管理系统的广泛应用, 人们积累的数据越来越多。数据挖掘(Data Mining) 就是从大量的实际应用数据中提取隐含信息和知识, 它利用了数据库、人工智能和数理统计等多方面的技术, 是一类深层次的数据分析方法。本文介绍了数据库技术的现状、效据挖掘的方法以及它在 B ayesian 网建网技术中的应用:通过散据挖掘解决 Bayesian 网络建模过程中所遇到的具体问题, 即如何从太规模效据库中寻找各变量之间的关系以及如何确定条件概率问题。数据的迅速增加与数据分析方法的滞后之间的矛盾越来越突出, 人们希望在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理, 但是目前所拥有的数据分析工具很难对数据进行深层次的处理, 使得人们只能望“数”兴叹。数据挖掘正是为了解决传统分析方法的不足, 并针对大规模数据的分析处理而出现的。数据挖掘通过在大量数据的基础上对各种学****算法的训练, 得到数据对象间的关系模式, 这些模式反映了数据的内在特性, 是对数据包含信息的更高层次的抽象。目前, 在需要处理大数据量的科研领域中, 数据挖掘受到越来越多的关注, 同时, 在实际问题中, 大量成功运用数据挖掘的实例说明了数据挖掘对科学研究具有很大的促进作用。数据挖掘可以帮助人们对大规模数据进行高效的分析处理, 以节约时间, 将更多的精力投入到更高层的研究中, 从而提高科研工作的效率。数据挖掘使用一定的算法从实际应用数据中挖掘出未知、。有价值的模式或规律等知识, 整个过程由数据准备、数据挖掘、模式评估、巩固知识和运用知识等步骤组成。 .数据准备数据挖掘的处理对象是数据, 这些数据一般存储在数据库系统中, 是长期积累的结果。但往往不适合直接在这些