文档介绍:云计算平台:基于Hadoop的研究一、云计算有关发展趋势2006年,Google提出云计算概念后,不断有IT厂商推出属于自己的云计算平台。2010年,云计算已经从概念逐渐走向应用层面。2013年11月12日,首届云计算用户大会开幕,云计算产业进一步促进。随着互联网的高速发展、移动互联网应用不断创新、三网融合步伐加速、以及国家“两化融合”产业基地建设加快,中国云计算产业发展有了良好的发展机遇,更多的厂商开展云计算布局并积极加大研发与推广,创新产品线不断推出,围绕着云计算研发与应用推广的产业链逐渐形成。如果把以往计算机发展分为三个阶段,那就是主机、个人PC机和互联网时代,我们现在已经进入到云计算时代。从技术层面来看,云计算是一种资源的池化,通过互联网向用户提供按需按量的计算服务。云计算主要包括IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)三种服务模式,Hadoop是一种用于构建PaaS的云计算模型,它是Google云计算的主要技术GFS和MapReduce的开源实现。利用Hadoop,在底层可以实现对集群的管理;在上层可以很方便地构建企业级的应用。近来,云计算产业界和科技界紧跟世界发展潮流,技术研发、理论研究和推广应用不断发展。正是在此大环境下,我国的云计算产业才得以快速发展。越来越多的用户正在接受并使用着各种云计算的应用。业界对云计算的关注和探讨逐渐从服务商、制造商的角度转向用户的使用和体验的角度。随着云计算技术趋向成熟,高校信息化技术也翻开了新的一页。结合高校信息化的特点,以云计算技术为依托,对内进行IT资源整合,提升资源利用率和科研水平;对外通过高性能计算云平台来支撑科学计算,以产学研的能力,在应用层面推动云计算的落地。2008年以来,云计算得到了快速的发展,已经从理论研究迈入了应用开发时期,国家“十二五”规划把云计算作为新一代IT产业研发与应用的重要领域之一,云计算将推动我国的IT产业实现跨越升级。从技术的角度来看,面向服务的体系结构是云计算的一项重要内容,搞好基于其的应用云建设,将有助于促进服务质量的提高。SOA(ServiceOrientedArchitecture,面向服务的体系结构)是为业务需求提供服务的体系结构,它可以把企业所有相关的系统的组件接口和各个不同的服务单元以及绑定于那些服务的信息联系起来,并将服务抽象为业务流程,从而得到新的解决方案。SOA为系统结构增添了灵活性,使得对系统的修改非常方便,而不需要重复的对系统进行开发,这些优点对云计算的可扩展性以及灵活管理是不可或缺的。基于SOA的应用云有利于更加合理、高效地使用企业内部的资源库,促进服务质量的提高。二、Hadoop技术探析基于开源的Hadoop模型进行云计算平台搭建,需要对Hadoop技术进行探析。Hadoop是Apache开源组织的一个分布式计算框架,可以在大量廉价的硬件设备所组成的集群上开发和运行处理海量数据。它能构建一个具有高可靠性和良好扩展性的分布式系统,任何普通的PC上安装运行hadoop框架集群,都可用来高效处理海量的信息。Hadoop集群是典型的主(Master)/从(Slave)结构,Master由NameNode和JobTracker组成,Slave由DataNode和TaskTracker组成。Hadoop框架由许多子项目组成