文档介绍：6动态规划模型举例
k=3 时，

k=2时 , f2(B1)=13,u2(B1)=C2
f2(B2)=16,u2(B2)=C3
k2，…，n）。已知下列数据及函数关系：第k周的需求量dk：第k周产量为uk时的生产费ck（uk）；第k周初贮存量为xk时这一周的贮存费hk（xk）；第k周的生产能力限制Uk；初始（k=0）及终结（k=n）时贮存量均为零。按照最短路问题的思路，设从第k周初贮存量为x 到（n周末）过程结
Date
15
束的最小费用函数为f（x ），则下列逆向递推公式成立。
（1）
而xk与xk+1满足
(2)
　　
这里贮存量x是状态变量，（2）式给出了相邻阶段的状态在决策变量作用下的转移规律，称为状态转移规律。在用（1）式计算时，xk的取值范围——允许状态集合Xk由（2）式及允许决策集合（0≤uk≤Uk）决定。
Date
16
在实际问题中，为简单起见，生产费用常ck（uk）=0
(uk=0)；ck(uk)=a+c uk(uk＞0)，其中c是单位产品生产费, 而a是生产准备费。贮存费用常取hk（xk）= h xk， h是单位产品（一周的）贮存费。
　　最优方程（1）和状态转移方程（2）构成了这个多阶段决策问题的动态规划模型。实际上，多阶段决策问题有时也可用静态规划方法求解，如例2的生产计划问题。
　例15 　资源分配问题。总量为m1的资源A和总量为m2的资源B同时分配给n个用户，已知第k用户利用数量uk的资源A和数量v 的资源B时，产生的效益为gk（uk, vk ），问
Date
17
如何分配现有资源使总效益最大。
解：这本来是个典型的静态规划问题：
Max Z = (1)
(2)
(3)
但是当gk比较复杂及n较大时，用非线性规划求解是困难的，特别是，若gk是用表格或图形给出而无解析表达式时，则难以求解。而这种情况下，将其转化为
Date
18
动态规划，是一种可行的方法。
资源A，B每分配给一个用户划分为一个阶段，分配给第k用户的数量是二维决策变量（uk, vk），而把向第k用户分配之前，分配者手中掌握的资源数量作为二维状态变量，记作（xk，yk），这样，状态转移方程应为

(4)
Date
19
最优值函数fk（xk，yk）定义为将数量xk，ky的资源分配给第k至第n用户时能获得的最大效益，它满足最优方程