1 / 28
文档名称:

数据挖掘与云计算简介.doc

格式:doc   页数:28页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘与云计算简介.doc

上传人:cdsqbyl 2015/4/14 文件大小:0 KB

下载得到文件列表

数据挖掘与云计算简介.doc

文档介绍

文档介绍:数据挖掘与云计算的发展和应用
目录
摘要 3
一. 什么激发了数据挖掘,它是怎样诞生的 4
(一) 数据时代的发展历程 4
(二) 数据挖掘工具成为一种迫切的数据分析工具 4
(三) 数据挖掘的发展阶段 5
1. 电子邮件阶段 5
2. 信息发布阶段 5
3. EC(merce),即电子商务阶段 6
4. 全程电子商务阶段 6
二. 数据挖掘的概述 7
(一) 什么是数据挖掘 7
(二) 数据挖掘的步骤 8
1. 数据清理 8
2. 数据集成 8
3. 数据选择 8
4. 数据交换 8
5. 数据挖掘 8
6. 模式评估 8
7. 知识表示 8
(三) 我们需要对何种数据进行数据挖掘 8
1. 关系数据库 9
2. 数据仓库 9
3. 事务数据库 9
4. 高级数据和信息系统与高级应用 10
三. 数据挖掘的应用 11
(一) 数据挖掘的应用领域 11
1. 企业应用 11
2. 科学研究。 12
3. 。 12
4. 在医学上的应用。 12
5. 在金融上的应用。 13
(二) 数据挖掘在各个行业的应用 14
1. 数据挖掘在电信领域的应用。 14
(1) 电信业务概述 14
(2) 数据挖掘在电信业中的应用背景 15
(3) 数据挖掘应用于电信业中的实例 16
2. 数据挖掘在游戏领域的应用。 18
(1) 数据挖掘应用于游戏领域的背景 18
(2) Web挖掘在网页游戏开发及运营中的作用 18
(3) 指导网页游戏的开发 19
(4) 促进和帮助网页游戏的更新和升级 19
(5) 帮助企业保有一定数量个客户群并挖掘潜在客户 19
(6) 提高点击率增加广告收益 20
四. 数据挖掘与云计算的发展趋势和前景 21
(一) 数据挖掘的发展趋势和前景 21
1. 改进数据挖掘算法。 21
2. 数据挖掘原语。 21
3. OLAM。 22
4. 可视化数据挖掘。 22
5. Web数据挖掘。 22
6. 多媒体数据挖掘。 22
(二) 云计算的发展趋势和前景 23
1. 云计算的提出和概念 23
2. 云计算的发展。 23
五. 数据挖掘与云计算的关系 25
(一) 基于云计算的数据挖掘分析 25
参考文献 26
摘要
数据挖掘是一项通用的知识发现技术。数据挖掘日益受到了人们的关注,并已成为当前计算机领域的一大热点。数据挖掘带来的了显著的经济效益,最先应用于金融和工商业领域。它们都在利用数据挖掘技术帮助管理客户生命周期的各个阶段,包括争取新的客户、在已有客户的身上赚更多的钱和保持好客户。当然电信也应用的相当广泛。电信业务的特点是数据量庞大,业务系统众多,所以积累了大量的数据资源可供挖掘。云计算是一种基于互联网的、大众参与的计算模式,其计算资源(计算能力、存储能力、交互能力)是动态、可伸缩、且被虚拟化的,而且以服务的方式提供。过去对海量数据的处理主要是通过高性能机或者更大规模的计算设备来实现,现在通过基于云计算的数据挖掘能更好地达到目的。采用云计算模式有许多好处,成本低廉、容错性强、计算速度快、程序开发便捷、节点的增加更容易。可以说云计算是数据挖掘中普遍适用较为理想的计算模式,也是我们从海量数据中找到有用、可理解的知识的技术手段。
关键字:数据挖掘,知识发现,信息处理,云计算,海量数据
什么激发了数据挖掘,它是怎样诞生的
数据时代的发展历程
柏拉图曾经说过一句话,需要是发明之母。今年来,数据挖掘引起了信息产业和整个社会的极大关注,其主要原因是存在可以广泛使用的大量数据,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括市场分析、欺诈检测、顾客保有、产品控制盒科学探索等。
在过去的30年里,计算机硬件技术稳步的、令人吃惊的进步导致了功能强大的和价格可以承受的计算机、数据收集设备和存储介质的大量供应。这些技术大大推动了数据库和信息产业的发展,使得大量数据库和信息储存库用于事务管理、信息检索和数据分析。
数据挖掘工具成为一种迫切的数据分析工具
现在数据可以存储在很多不同类型的数据库和信息储存库中。最近出现的一种数据储存库的系统结构是数据仓库。这个是一种多个异构数据源在单个站点以统一的模式组织的储存库,以支持来管理决策。
数据丰富加上对强有力的数据分析工具的需求可描述为数据丰富,但信息匮乏。快速增长的海量数据收集、存放在大型和大量数据储存库中,没有强有力的工具,理解他们已经远远超出了人的能力。结果,收集在大型数据储存库中的数据变成了
“数据坟墓”—难得在访问的数据档案。如果这样的话,那么一些重要的决策常常不是基于数据储存库中信息丰富的数据,而是基于决