文档介绍:6动态规划模型举例
k=3 时,
k=2时 , f2(B1)=13,u2(B1)=C2
f2(B2)=16,u2(B2)=C3
k2,…,n)。已知下列数据及函数关系:第k周的需求量dk:第k周产量为uk时的生产费ck(uk);第k周初贮存量为xk时这一周的贮存费hk(xk);第k周的生产能力限制Uk;初始(k=0)及终结(k=n)时贮存量均为零。按照最短路问题的思路,设从第k周初贮存量为x 到(n周末)过程结
Date
15
束的最小费用函数为f(x ),则下列逆向递推公式成立。
(1)
而xk与xk+1满足
(2)
这里贮存量x是状态变量,(2)式给出了相邻阶段的状态在决策变量作用下的转移规律,称为状态转移规律。在用(1)式计算时,xk的取值范围——允许状态集合Xk由(2)式及允许决策集合(0≤uk≤Uk)决定。
Date
16
在实际问题中,为简单起见,生产费用常ck(uk)=0
(uk=0);ck(uk)=a+c uk(uk>0),其中c是单位产品生产费, 而a是生产准备费。贮存费用常取hk(xk)= h xk, h是单位产品(一周的)贮存费。
最优方程(1)和状态转移方程(2)构成了这个多阶段决策问题的动态规划模型。实际上,多阶段决策问题有时也可用静态规划方法求解,如例2的生产计划问题。
例15 资源分配问题。总量为m1的资源A和总量为m2的资源B同时分配给n个用户,已知第k用户利用数量uk的资源A和数量v 的资源B时,产生的效益为gk(uk, vk ),问
Date
17
如何分配现有资源使总效益最大。
解:这本来是个典型的静态规划问题:
Max Z = (1)
(2)
(3)
但是当gk比较复杂及n较大时,用非线性规划求解是困难的,特别是,若gk是用表格或图形给出而无解析表达式时,则难以求解。而这种情况下,将其转化为
Date
18
动态规划,是一种可行的方法。
资源A,B每分配给一个用户划分为一个阶段,分配给第k用户的数量是二维决策变量(uk, vk),而把向第k用户分配之前,分配者手中掌握的资源数量作为二维状态变量,记作(xk,yk),这样,状态转移方程应为
(4)
Date
19
最优值函数fk(xk,yk)定义为将数量xk,ky的资源分配给第k至第n用户时能获得的最大效益,它满足最优方程