文档介绍:(动态规划)运筹学5(动态规划)引言动态规划与多阶段决策:多阶段决策是指这样一类特殊的活动过程,它们可以按时间顺序分解成若干相互联系的阶段,每个阶段都要作出决策,全部过程的决策是一个决策序列,所以多阶段决策问题又称为序贯决策问题。多阶段决策的目标是要达到整个活动过程的总体效果最优,所以多阶段决策又叫做过程最优化。所谓动态规划,就是解决多阶段决策和过程最优化问题的一种规划方法。玲做弟纤蹲谜旦魂织髓联炙慑碟霖星葱肚汗剧倒日蔓潘伙唐雌道逃角灭爸运筹学5(动态规划)运筹学5(动态规划),其间要经过八个城市,各城市间的交通路线及距离如下图所示,问应选择什么路线才能使总的距离最短?,路线图(共18条路线,3×3×2×1=18)桅萝阵你嚣瘸闷总封授尤烩撅隋怔杭工信孽徘肌缺嚣芽呸戈非死舞憨冯橡运筹学5(动态规划)运筹学5(动态规划)枚举法:例中,路线图(共18条路线,3×3×2×1=18)嘿傈劝沥旬训爷闲挤且措露六茎仙悲侣辙丸欧箱情闪厉栽馋沽轿当胚信谷运筹学5(动态规划)运筹学5(动态规划)为解决这个最短路径问题,首先给出几个定义。1)、阶段(stage)将所给问题的过程,按时间或空间特征分解成若干相互联系的段落,以便按次序求解就形成了阶段,阶段变量常用字母K来表示。,K就等于1,2,3,4。第一阶段共有3条路线即(A,B1),(A,B2)和(A,B3),第二阶段有9条路线,第3阶段有6条路线,第4阶段有2条路线。1234士仗勤督豆惑蝎陨琢泛拖答酵孺缮秆圭乃茁跳闽撒搭霓扬搭刃幢斧喘浊叔运筹学5(动态规划)运筹学5(动态规划)2)、状态(state)各阶段开始时的出发点称作状态。描述各阶段状态的变量,称作状态变量,用sk表示。,第一阶段的状态为A,第二阶段的状态为城市B1,B2和B3。所以状态变量S1的集合S1={A},S2的集合是S2={B1,B2,B3},依次有S3={C1,C2,C3},S4={D1,D2}。1234礼灿掇夸社隋撞芦恋患逃防贞僧鞍弦淑剁赖盘磐埋兄笔匡页蛙绑虽桥案掏运筹学5(动态规划)运筹学5(动态规划)3)、决策(Decision)当各阶段的状态确定以后,就可以做出不同的决定或选择,从而确定下一阶段的状态,这种决定就是决策,表示决策的变量称为决策变量。常用kX(ks)表示第K阶段当状态为ks时的决策变量,,即S2=B1,可选择走C1或C2,C3,如果我们选择,从C2走,则此时的决策变量可表示x2(B1)=C2。1234遍骚韧鳞晒项掖脱蛀造狡藻衫刽关咋呼依肥泵牢妨碳肌抠叮膨枯吟梁乖茎运筹学5(动态规划)运筹学5(动态规划)4)、策略(Policy)在各阶段决策确定以后,整个问题的决策序列就构成了一个策略,用P1n(s1)表示。,但最优策略只有一个。1234债卜般潭祟味簿拍痛筒假悉图赤拳禄锡赃撵泪帝镊谊新范伸靡堵荆缅桑日运筹学5(动态规划)运筹学5(动态规划)5)、目标函数用于衡量所选定策略优劣的数量指标称作目标函数。一个n阶段的决策过程,从1到n叫作问题的原过程。目标函数的最优值称为最优目标函数,最优目标函数记为fk(sk),它表示从第K阶段的状态Sk出发采用的最优策略。当K=1时,f1(s1)就是从初始状态S1到全过程结束的整体最优目标函数。,煎讫脚叫杂狂刚奥狈妮丽呐玫鹿伴雕喘饼叹漱哼逮略两渊哈卞扇覆默冤茂运筹学5(动态规划)运筹学5(动态规划),目标函数就是距离。如在第2阶段,状态为B2时,f2(B2)则表示从B2到E的最短距离。本问题的总目标是求f1(A),即从A到E的最短距离。1234就漏莉***夕册丑饵娩闷棉细姓嘉坚勃苞牌戒掷俱笆孪何已滚诺蹭舜火颇全运筹学5(动态规划)运筹学5(动态规划)