文档介绍:基于云计算的海量数据挖掘
何清
中国科学院计算技术研究所
.cn/JS/ ~ heqing
Email: ******@.
2010-5-24 中国科学院计算技术研究所 1
内容提要
•云计算起算的兴起
•数据挖掘发展历程
•云数据挖掘实践
•云数据挖掘未来走向
2010-5-24 中国科学院计算技术研究所2
云计算的定义
• Wikipedi a: puting is ‐bdbased
computing, whereby shared resources, software
and information are provided puters and
other devices on‐demand, like the electricity grid.
It describes a new supplement, consumption and 
delivery model for IT services based on the , 
and it typically involves the provision of dynamically 
scalable and often virtualized resources as a service 
over the  
2010-5-24 中国科学院计算技术研究所3
云计算的定义
•云计算是一种基于互联网的、大众参与的计算模式,
其计算资源(计算能力、存储能力、交互能力)是
动态、可伸缩、且被虚拟化的,以服务的方式提供
•云计算是并行计算(puting)、分布式计算
(Distr ibute d puting)和网格计算(Gr id puting)
的发展,或者说是这些计算机科学概念的商业实现
•云计算是虚拟化(Virtualization) 、效用计算(Utility
Computing)、IaaS(基础设施即服务)、PaaS(平台即服
务)、SS(SaaS(软件即服务)等概念混合演进并跃升的结
果
2010-5-24 中国科学院计算技术研究所4
云计算的兴起
云计算风起云涌
2010-5-24 中国科学院计算技术研究所5
云计算的大事件候选
2010-5-24 中国科学院计算技术研究所6
2008年底中科院计算所开
发出基于云计算的并行数据
挖掘平台PDMiner
2010-5-24 中国科学院计算技术研究所7
机遇
•大大降低了中小企业购买昂贵IT设备的成本,
且可以享受大企业级的技术
•为服务器、PC、EU的销售带了机遇
•提供一种新的并行计算技术服务—云服务
–无需购买硬件
–无需开发软件
–在网络上就可以得到并行计算服务并能在线实
时监控
中国科学院计算技术研究所 2010-5-248
云计算的应用
•亚马逊网络服务(Amazon WebServices, AWS)
• Google应用软件引擎((gppgGoogle AppEngine, GAE) ,
Google地球、地图、Gmail、Docs等
•, 这这平一平
台可作为其他企业自身软件服务的基础
• IBM在2007年11月推出了“改变游戏规则”的“
蓝云”计算平台,为客户带来即买即用的云计算
平台
•微软在2008年10月推出了Windows Azure操作系统
2010-5-24 中国科学院计算技术研究所9
内容提要
•云计算起算的兴起
•数据挖掘发展历程
•云数据挖掘实践
•云数据挖掘未来走向
2010-5-24 中国科学院计算技术研究所10