1 / 103
文档名称:

动态规划完整.ppt

格式:ppt   大小:1,260KB   页数:103页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

动态规划完整.ppt

上传人:2623466021 2022/7/28 文件大小:1.23 MB

下载得到文件列表

动态规划完整.ppt

相关文档

文档介绍

文档介绍:动态规划完整
例 求解最短路问题




分阶段的最短途径
Ⅳ : C1—T 3
Ⅲ --Ⅳ : B1—C1—T 4
Ⅱ--Ⅲ-过程,由依次进行的 n 个阶段决策构成的决策序列,简称策略,表示为 。从 k 阶段到第 n 阶段,依次进行的阶段决策构成的决策序列称为 k 部子策略,表示为 ,显然当 k=1时的 k 部子策略就是全过程策略。
(5) 状态转移方程
状态转移确定从一个状态到另一个状态的转移过程, 由状态转移方程描绘: sk+1 = T (sk, xk);
状态转移方程在大多数情况下可以由数学公式表达, 如: sk+1 = sk + xk;
(6) 指标函数
用来衡量策略或子策略或决策的效果的某种数量指标,就称为指标函数。它是定义在全过程或各子过程或各阶段上确实定数量函数。对不同问题,指标函数可以是诸如费用、本钱、产值、利润、产量、耗量、间隔 、时间、效用,等等。
用vk(sk , xk)表示第 k 段处于状态 sk且所作决策为 xk 时的指标,那么它就是第 k 段指标函数,简记为vk 。
用f(sk , xk)表示第k子过程的指标函数。表示处于第 k 段 sk 状态且所作决策为xk时,从 sk 点到终点的间隔 。由此可见, f(sk , xk)不仅跟当前状态 sk 有关,
〔2〕过程指标函数〔也称目的函数〕
〔1〕阶段指标函数〔也称阶段效应〕
还跟该子过程策略 pk(sk) 有关,严格说来,应表示为 fk(sk , pk(sk)) 。它是由各阶段的阶段指标函数 vk(sk , xk)累积形成的,对于 k 部子过程的指标函数可以表示为:
式中,表示某种运算,可以是加、减、、乘、除、开方等.
多阶段决策问题中,常见的目的函数形式之一是取各阶段效应之和的形式,即:
有些问题,如系统可靠性问题,其目的函数是取各阶段效应的连乘积形式,
(7) 最优解
用 fk* (sk) 表示第 k 子过程指标函数Fk(sk , pk(sk))在状态 sk 下的最优值,即:
称 fk(sk) 为第 k 子过程上的最优指标函数;与它相应的子策略 pk(sk) 称为状态 sk 下的最优子策略,记为 pk*(sk)
例 用动态规划求解最短路问题
最短路的求解:
阶段: 可分为4个阶段, k = 1, ..., 4。
状态: 可用城市编号, S1={Q}, S2={A1,A2,A3}, S3={B1,B2,B3}, S4={C1,C2}, S5={T}
决策: 决策变量也可用城市编号;
状态转移方程: sk+1= xk;
阶段指标函数:

过程指标〔阶段递推〕函数:
k = 4
f4 (C1) = 3, f4 (C2) = 4
k = 3
f3(B1)=min{1+f4(C1)=4*, 4+f4(C2)=8}=4
f3(B2)=min{6+f4(C1)=9, 3+f4(C2)=7*}=7
f3(B3)=min{3+f4(C1)=6*, 3+f4(C2)=7}=6

k = 2
f2(A1) = min{7+ f3(B1), 4+ f3(B2), 6+ f3(B3) } = min{11*, 11*, 12} = 11
f2(A2) = min{3+ f3(B1), 2+ f3(B2), 4+ f3(B3) } = min{7*, 9, 10 } = 7
f2(A3) = min{4+ f3(B1), 1+ f3(B2), 5+ f3(B3) } = = min{8*, 8*, 11 } = 8
k = 1
f1(Q) = min{2+f2(A1), 4+f2(A2), 3+f2(A3)} = min{13, 11*, 11* } = 11
最短路是:Q A2  B1  C1  T,p={A2,B1,C1,T}
Q A3  B1  C1  T ,p={A3,B1,C1,T}
Q A3  B2  C2  T ,p={A3,B2,C2,T}
整个过程的最优策略应具有这样的性质: 无论过去的状态和决策如何, 对前面的决策所形成的状态而言, 后续的诸决策必须构成最优策略;
上一条成立的条件是阶段递推函数严格单调。
二、动态规划的最优性原理
在例题中,求解最短道路的计算公式