文档介绍:第卷第期软件导刊
9 % 2
2010年 2月 Software Guide Feb. 2010
分布式渲染调度策略优化研究与实现
徐文莉
(武汉科技大学中南分校信息工程学院计算机网络系,湖北武汉 430223)
摘要:围绕如何提高分布式渲染任务执行效率这一目标,重点研究了 LSF 作业管理系统工作原理以及扩展调度插
件机制,设计并实现了依据服务节点负载量及处理能力选择候选主机的分布式渲染调度算法(DRS),并利用 LSF 调
度插件嵌入自定义调度模块,该模块能与系统内置调度模块协同工作。最后构造仿真集群执行环境,通过模型渲染
验证了算法的有效性。
关键词:分布式渲染;调度算法;LSF
中图分类号:TP312 文献标识码:A 文章编号:1672-7800(2010)02-0010-03
2 LSF工作原理
1 分布式渲染工作流程
作业调度器与资源管理器
(Plugin Schedulers) LIM(Load
是进行作业管理的核心如图所示
分布式渲染平台实际上是将一组计算机通过网络通信协 Information Manager) LSF 2 :
议连接在一起的计算集群集群系统并行程序运算的瓶颈在于
。
通信过大的通讯延迟将影响运算速度建立合适的系统内联
, 。
网络才能保证运算节点间数据传输率分布式系统的求解过
, 。
程主要分为个步骤任务分解任务调度并行计算解的合
4 : 、、、
成在进行网络集群渲染的过程中渲染任务被逐帧分配到各
。,
个服务节点未涉及单帧同步渲染问题最后的渲染结果将被
( )。
收集在网络中的一个共享目录里如图所示
1 :
图 2 LSF 作业管理相关模块及文件
是默认的调度策略当有新作业到达时先将作
FCFS LSF 。,
业放进配置为先来先服务的等待队列里然后根据资源管理器
,
收集的主机负载信息结合一定的资源调度策略选择合适
LIM ,
主机并按照排序算法确定候选主机队列
, , 。
支持的作业运行队列由文件记录集群管
LSF lsb。 params 。
理系统可配置成拥有一个或多个默认队列用户可使用默认队
。
图分布式渲染工作流程列或自定义作业队列另外通过管理软件接口也可
1 。, (LSBLIB)
当用户完成维场景制作后通过管理软件接口将该渲染将作业提交给
3 , LSF。
任务提交给管理软件管理软件启动后告知管理服务器有渲
, ,
染任务管理服务器通过负载监控功能在网络中查找负载较
。, 3 分布式渲染调度算法(DRS) 设计
轻节点发现适合资源后进行任务分配渲染节点接到任务
, , 。
后开始渲染并把节点信息实时发送给管理服务器管理服务维渲染任务需要强大的浮点运算能力及较大的内
, , , 3 CPU
器把收到的信息反馈给管理软件及用户整个场景渲染完成存容量基于静态调度算法与动态调度算法的差异考虑采用
。, 。,
用户得到可以应用的图片序列以供效果调整审定或后期制作一种动态调度算法利用各节点负载信息做出实时任务调度
, , ,
合成之用决策保证各服务节点负载均衡提高系统吞吐率
。