文档介绍:存储器四大分类图什么叫Scaleout体系架构呢,所谓Scaleout体系架构是指基于横向扩展的体系架构的思路,即整个系统一开始由一个小机器构成,随着业务需求的增加,通过把更多的小机器添加进去并且连接在一起,组成一个更大的机器(多台机器采用统一管理),这种思路在服务器体系架构中叫做scaleout,及横向扩展的集群式计算机系统。Scaleout架构和早期的三大经典体系架构(基于阵列卡技术的存储器,基于集群技术的模块化存储器和基于scaleup架构的大存储器件架构)的区别在哪里呢?笔者认为,这也设备厂商本身的技术积累和市场接受程度很有关系。如果这种设计思路在行业里刚刚涌现是一种全新的设计思路,由于刚刚出现,我们暂时无法将其归纳到一个大类中,因此也称其为创新型架构,等到过一段时间,如果这种设计思路确实不错,采用这种思路的人多了,可能就会成为一个趋势,那么就会把这种体系架构单独划分为一类。Scaleout就是新兴类别的典型代表。比如说当早期3PAR公司独家采用缓存统一编址分布式处理器scaleout架构时,仅仅属于一个技术创新,笔者2年前会把它归纳到创新体系架构类,而最近采用类似架构设计存储器的厂商变多了,特别是EMC最新的VMAX系列、Pillar的Axiom系列也加入到其中,因此笔者就把它单独拎出来成为了四大主流体系架构之一了(此时scaleout架构也成了四大天王中的一员)。可见存储器技术的发展和体系架构的划分也是与时俱进的….如果我们把Scaleout横向扩展的体系架构进一步划分,又可以再细分成两种思路,一种是分布式缓存但统一编址的numa架构,其核心思想是多个节点的缓存是统一编址的,其代表产品是3PAR的InServT系列和EMC的SymmetrixV-MAX系列,笔者将在后面的章节详细阐述;而另一种是每个节点各种管理控制器内部缓存的MPP分支,其代表产品包括HP公司的P4000系列(收购Lefthand公司产品得来)、IBM公司的XIV系列(收购XIV公司产品发展而来)、DELL公司的Equalogical系列(收购Equalogical公司产品发展而来)、民族产业的代表龙存科技的LoongStore系列。各位看官可能会发现一个很有意思的问题,这种ScaleoutMPP体系架构的产品虽然分别为IBM/HP/DELL三大IT巨头公司所掌握,但都是通过收购而来,而那些被收购的公司往往都名气不大,可见这种架构的存储器确实是存储行业中相对的新鲜事物,而这些新兴事务也往往符合最新云计算架构中云存储的设计思路…下文中我们将探讨一下这个scaleout体系架构的MPP分支到底是个什么东东…  采用Scaleout体系架构的MPP分支的思路分析我们前文说过,为了能够让更多的处理器协同工作,计算机工业提出了SMP体系架构,-numa体系架构,这两种体系架构从本质上来讲有一个共同的特点,即各个处理器上缓存是统一编址的(从编程的角度来看,这么多处理器组成的服务器的内存是一个连续的内存空间,非常有利于编程人员设计程序),当然SMP的特点是所有的处理器访问缓存的延迟是固定的,而cc-numa架构就会出现缓存访问延迟不一致的情况,-numa带来的额外的好处就是整个系统的扩展能力会进一步加强。当然还有另外一种情况是有些业务系统不需要统一缓存编址,比如象渲染,一个泰坦尼克大片,这么多画面需要渲染,没有必要放在一个大机器里面做,而可以把任务分解成多个小任务单独做,做好以后再收集在一起合成就可以了,这种情况下就没有必要采用numa架构和SMP架构的大机器了(节约成本),而可以采用将多个服务器节点组成一个大型的cluster。这些服务器之间通过专用快速网络连接起来形成一个虚拟的整体,当然在这种情况下每个节点的服务器内存空间是各自独立管理而不是统一编址了。下图是采用MPP体系架构的计算机示意图: MPP体系结构示意图MPP体系架构的计算机的特点:由数百个乃至数千个计算结点和I/O结点组成,这些结点由局部网卡(NIC)通过高性能互联网络相互联接。每个结点相对独立,并拥有一个或多个微处理器(P/C)。这些微处理器均配备有局部Cache,并通过局部总线或互联网络与局部内存模块和I/O设备相联接。MPP的各个结点均拥有不同的操作系统映像。一般情况下,用户可以将作业提交给作业管理系统,由它负责调度当前最空闲、最有效的计算结点来执行该作业。但是,MPP也允许用户登录到某个特定的结点,或在某些特定的结点上运行作业。各个结点间的内存模块相互独立,且不存在全局内存单元的统一硬件编址。一般情形下,各个结点只能直接访问自身的局部内存模块,如果要求直接访问其他结点的局部内存模块,则必须有操作系统的特殊软件支持。从上述表述中,我们可以看到,MPP体系架构的计算机本质上就是我们日常生活中