文档介绍:2017/11/11
管理运筹学课程组 ftp://
1
动态规划(Dynamic Programming)
R. Bellman50年代执教于普林斯顿和斯坦福大学,后进入兰德(Rand)研究所。1957年发表“Dynamic Programming”一书,标识动态规划的正式诞生。
动态规划的研究对象和引例
动态规划的理论基础和具体迭代方法
动态规划的基本思想和基本方程
动态规划的基本概念和定义
动态规划是解决复杂系统优化问题的一种方法。是解决动态系统多阶段决策过程的基本方法之一。
2017/11/11
管理运筹学课程组 ftp://
2
教学大纲:
理解:动态规划基本概念、最优化原理和基本方程,通过资源分配和生产与存储等问题,学习应用动态规划解决多阶段决策问题。
重点: 掌握动态规划模型结构、逆序法算法原理、资源分配、设备更新、生产于存贮等问题。
难点:为动态规划中状态变量等的确定。
2017/11/11
管理运筹学课程组 ftp://
3
1
2
3
4
5
第一节动态规划的研究对象和引例
引例1 最短路问题
A
1
2
3
4
5
6
7
8
E
6
4
5
8
7
7
8
9
3
3
8
9
5
6
5
6
2
1
3
4
2017/11/11
管理运筹学课程组 ftp://
4
引例2:生产与存贮问题
某工厂生产并销售某种产品,已知今后4个月市场需求预测如表2-1所示,每月生产单位产品的费用为
其中为生产的固定费用,为可变生产费率,为生产能力。供应需求所剩余产品应存入仓库,每月库存单位产品的费用为
(千元)
2017/11/11
管理运筹学课程组 ftp://
5
计划开始和计划期末库存量都是0。试制定4个月的
生产计划,在满足用户需求的条件下使总费用最小。
i
1
2
3
4
需求
2
3
2
4
2017/11/11
管理运筹学课程组 ftp://
6
包含随时间变化的因素和变量的系统。
系统在某个时刻的状态,往往要依某种形式受过去某些决策的影响;
将时间作为决策变量之一的决策问题称为动态决策问题。
如经济系统,生产系统等。
动态系统:
线性系统、非线性系统。
动态系统
的特点:
动态决策
问题:
而系统的当前状态和决策又会影响系统今后的发展。
动态规划的研究对象:
2017/11/11
管理运筹学课程组 ftp://
7
即在系统发展的不同时刻(或阶段)根据系统所处的状态,不断地做出决策;
每个阶段都要进行决策,目的是使整个过程的决策达到最优效果。
动态决策问题的特点:
系统所处的状态和时刻是进行决策的重要因素;
找到不同时刻的最优决策以及整个过程的最优策略。
多阶段决策问题:
是动态决策问题的一种特殊形式;
在多阶段决策过程中,系统的动态过程可以按照时间进程分为状态相互联系而又相互区别的各个阶段;
2017/11/11
管理运筹学课程组 ftp://
8
多阶段决策问题的典型例子:
1 . 生产决策问题:企业在生产过程中,由于需求是随时间变化的,因此企业为了获得全年的最佳生产效益,就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。
2. 机器负荷分配问题:某种机器可以在高低两种不同的负荷下进行生产。在高负荷下进行生产时,产品的年产量g和投入生产的机器数量u1的关系为
g=g(u1)
1
2
n
状态
决策
状态
决策
状态
状态
决策
2017/11/11
管理运筹学课程组 ftp://
9
这时,机器的年完好率为a,即如果年初完好机器的数量为u,到年终完好的机器就为au, 0<a<1。
在低负荷下生产时,产品的年产量h和投入生产的机器数量u2的关系为
h=h(u2)
假定开始生产时完好的机器数量为s1。要求制定一个五年计划,在每年开始时,决定如何重新分配完好的机器在两种不同的负荷下生产的数量,使在五年内产品的总产量达到最高。
相应的机器年完好率b, 0< b<1。
2017/11/11
管理运筹学课程组 ftp://
10
3. 航天飞机飞行控制问题:由于航天飞机的运动的环境是不断变化的,因此就要根据航天飞机飞行在不同环境中的情况,不断地决定航天飞机的飞行方向和速度(状态),使之能最