文档介绍:中国通信标准化协会
课题编号:
互联网云计算与P2P技术研究报告
(征求意见稿)(题目建议用云计算)
完成单位:
中国移动
工业和信息化部电信研究院
中国电信
2009年 9 月
研究报告要点
本报告讨论了云计算中的主要技术,云计算对互联网的影响,云计算存在的主要问题,比较了云计算技术与P2P技术、网格技术的异同点,分析了DSN(distributed work)与云计算的关系,最后提出DSN与云计算结合应用的思路和方案。
概念与背景
云计算基本概念
云计算(puting)是分布式计算(puting)、并行计算(puting)和网格计算(puting)的发展,或者说是这些计算机科学概念的商业实现。它是一种动态的、易扩展的、且通常是通过互联网实现的虚拟化的计算方式。用户不必具有云内部的专业知识,不需要了解云内部的细节,也不直接控制基础设施。(定义应说清楚)
云计算的基本原理是:计算资源分布在网络侧大量的计算机上,而非本地计算机或单台集中式远程服务器中,用户通过接入互联网、利用云提供的编程接口、云计算终端软件或者浏览器访问云提供的不同服务,把“云”做为数据存储以及应用服务的中心。
云计算的行业背景与分析
云计算的商业应用与商业计划
Amazon的“云”
图1-1 Amazon的云计算
Amazon从2002年7月开始推出Amazon Web Services,为互联网应用提供开放式的通用平台。截至2007年7月,注册开发者已经达到330000。目前,pute Cloud(EC2)、Elastic Block Store(EBS)、
SimpleDB、Simple Storage Service(S3)、CloudFront、Simple Queue Service(SQS)等功能平台,计费、安全、网管等运营支撑平台,以及其它一些商业应用平台。
其中,S3是Amazon推出的最早的云计算服务,提供无限量的文档、照片、音视频和其他数据的存储。该服务被许多软件公司采用为客户提供下载和网络存储服务。截止到2009年3月,其存储量达到了520亿个对象。迄今为止,S3的详细设计没有公开,其目标是实现高可扩展性、高业务可用性、低时延以及廉价的存储。S3单个对象不得超过5GB,配以最大2KB的metadata。每个AWS账户可拥有数个bucket,其中包含分别具有唯一用户指定key的数个对象。支持REST类型的HTTP接口或者SOAP接口进行对象的生成、列表和检索,并支持通过HTTP GET接口或者BT协议下载对象。
用户可以租用基于Xen的EC2云计算平台,利用虚拟化技术建立服务器实例,运行其自身的应用。用户可以随意关停虚拟服务器,并仅对激活的服务器进行付费。用户可以在不同区域建立服务器实例并互为备份,以最小化宕机的风险。在2008年8月,Amazon 又推出了EBS(Elastic Block Store,弹性块存储)以完善EC2的云存储功能。
Sun的“云”
图1-2 Sun的云计算
Sun公司也基于云计算理论提出,未来的数据中心不会再被局限在拥挤而闷热的机房里,而是一个个可移动的集装箱,企业可以把它移动到包括“郊外”在内的各种地方,降低机房的开支。2008年5月,Sun在2008JavaOne开发者大会上宣布推出“Hydrazine”计划(参见图1-2),基于“Hydrazine”计划,Sun希望利用其核心技术打造一个包含网络环境、数据中心和其他基础设施组件在内的完整解决方案,如Sun JavaFX的丰富互联网应用程序技术、Sun的Glassfish应用服务器、Sun企业服务总线、Sun目录服务器、MySQL、“廉价存储
”和Sun的硬件,从而使得开发人员利用Sun平台创建托管应用与服务,并且不用到任何其它地方就可以利用这些应用程序和服务赚钱。此外,作为“Hydrazine计划”的一部分,Sun还推出了“Insight计划”。这个分析功能可以让开发人员知道谁在使用他们的产品,并利用这个功能注入广告赚钱。
Google的“云”
图1-3 Google的云计算
Google则以开源的姿态推广它的云计算平台,这使得用户可以得到这个平台的代码并修改它。2006年,Google使用MapReduce技术,通过40台服务器集群构建了第一个云。Google的数据中心在节能、速度、成本方面很有优势,因而Google能够以极低的成本增添运算能力。如图1-3所示,其云计算架构主要包括集群管理和控制系统(Cluster)、分布式并行计算(MapReduce)、分布式数据管理(BigTable)、分布式文件存储(GFS)、分