1 / 71
文档名称:

高性能计算.pptx

格式:pptx   大小:5,928KB   页数:71页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

高性能计算.pptx

上传人:陈潇睡不醒 2020/12/19 文件大小:5.79 MB

下载得到文件列表

高性能计算.pptx

文档介绍

文档介绍:如何快速构建高性能集群系统
解决方案中心
马少杰
部署规划及硬件安装
Sugon HPC Installer 批量部署操作系统
Clusconf 快速配置集群
Clussoft 快速安装软件
部署规划及硬件安装
千兆交换机
局域网
Internet
路由器
防火墙
远程控制
内网
外网
以太网
交换机
控制台
本地KVM
以太网
光纤网
Infiniband网
KVM管理网
登陆/管理节点
机房环境
并行存储系统
高速Inifiniband交换机
刀片集群
GPGPU节点
计算系统
存储系统
SMP胖节点
2
算例上传
作业提交
本地建模
1
本地建模
1
1011000110101001000100100100100110001101010010001001001100011010100100010010011000110101001000100100001001001100011010100001001001100011010100001001001100011010100001001001**********
作业运行
3
数据访问与存储
4
系统管理与用户管理
5
高性能计算作业的工作流程
集群配置表
机柜摆放
功耗14KW
功耗10KW
功耗10KW
功耗14KW
功耗14KW
普通风冷单机柜不能超过15千瓦,且各机柜负载最好均衡
控制台放置为中间机柜19U左右
交换机放置中间机柜,如果为上走线,则在机柜上部
原则1:同类相邻
同一种类型节点(硬件、操作系统,用途等)应该是连续的编号
原则2:从多到少
按用途:计算节点、IO节点、管理节点
计算节点内部:刀片最多,GPU节点其次,胖节点最少
原则3:从高到低
高端到低端:八路、四路、双路 内存容量:64G、32G、16G 高度越高:5U、4U、2U、1U
以上原则冲突时,优先级:原则1〉原则2〉原则3
节点编号
CB85刀片计算节点:64台
GPU计算节点:8台
A950八路胖节点:2台
A840四路胖节点:2台
IO节点:4台A620
管理节点:2台A620
node1-node64 刀片CB85
node65-node72 GPU节点
node73-node74 A950
node75-node76 A840
node77-node80 IO节点A620
node81-node82 管理节点A620
第一套以太网络,配置为管理网
所有服务器的第一块网卡(eth0)接入同一物理网络,配置为集群管理网。机架式服务器对应第一块网卡eth0;刀片机箱对应第一个网络模块(一般是交换模块)。
管理网络IP地址和主机名规范为:
管理网对应的主机名“node”默认设置为系统主机名。此外,需要根据节点功能,在/etc/hosts中设置主机别名,比如:
node1 comput1

node10 comput10
node11 io1
node12 io2
node13 admin1
node14 admin2
IP地址
IPMI IP地址设计
IPMI网络IP地址和主机名规范为:
刀片管理模块IP地址和主机名规范为:
IP地址设置
IP地址
子网掩码
主机名前缀


mnode
IP地址
子网掩码
主机名前缀


mblade
第二套以太网络(如果有,配置为备用管理网络或千兆计算网络)
Infiniband网ipoIB IP地址和主机名规范为:
IP地址设置
IP地址
子网掩码
主机名前缀


bnode
IP地址
子网掩码
主机名前缀


inode
上架、布线、贴标签、上电。。。。。。