文档介绍:关于最优化技术基础
第一页,讲稿共二十七页哦
▲最优策略:对应于一个策略,可以由一个量化的指标来确定这个策略对应的效果,不同的策略有各自的效果。在所有可供选择的策略中,对应效果最好的策略称为最优策略。
多阶段决策过程最优而使计算量比枚举法大为减少。
第七页,讲稿共二十七页哦
使用动态规划方法解决多阶段决策问题,首先要将实际问题写成动态规划模型,需要对动态规划的一些基本术语加以说明和定义:
1. 阶段
为了便于求解和表示决策及过程的发展顺序,而把所给问题恰当地划分为若干个相互联系又有区别的子问题,称之为多段决策问题的阶段。一个阶段,就是需要作出一个决策的子问题,通常,阶段是按决策进行的时间或空间上先后顺序划分的。
用以描述系统在某特定的时间与空间域中所处位置及运动特征的量,称为状态。每个阶段的状态可分为初始状态和终止状态,阶段k的初始状态记作sk,终止状态记为sk+1。但通常定义阶段的状态即指其初始状态,故阶段k的终止状态sk+1为阶段k+1的初始状态。
描述过程k的状态变量称为状态变量sk ,其取值范围称为可能状态集Sk, 即sk∈Sk。
第八页,讲稿共二十七页哦
3. 决策和决策变量
决策是状态的选择,是决策者从给定阶段状态出发对下一阶段状态作出的选择。
描述决策变化的量称之决策变量,和状态变量一样,决策变量可以用一个数或一向量来描述,也可以是状态变量的函数,记以uk= uk(sk),表示阶段k状态sk时的决策变量。
决策变量的取值也有一定的允许范围,称之允许决策集合Uk(sk), uk(sk)∈Uk(sk)。
全过程策略(Policy) 是依次进行的全部n个阶段决策构成的决策序列,表示为p1,n{u1,u2,…,un}; 从k阶段到第n阶段,依次构成的决策序列称为k部子策略,表示为pk,n{uk,uk+1,…,un} ,显然当k=1时的k部子策略就是全过程策略。
在实际问题中,由于在各个阶段可供选择的决策有许多个,因此,它们的不同组合就构成了许多可供选择的决策序列(策略),它们组成”允许策略集”,记作P1,n ,从中找出具有最优效果的策略称为最优策略。
第九页,讲稿共二十七页哦
系统在阶段k处于状态sk,执行决策uk(sk)的结果是系统状态的转移,即系统由阶段k的初始状态sk转移到终止状态sk+1,或者说由k阶段的状态sk转移到了k+1阶段的状态sk+1。
对于具有无后效性的多阶段决策过程,系统由阶段k到阶段k+1的状态转移完全由阶段k的状态sk和决策uk(sk)所确定,与系统过去的状态s1,s2,… ,sk-1及其决策u1(s1), u2(s2)…uk-1(sk-1)无关。系统状态的这种转移,用数学公式描述即有:
(1)
式(1)称为多阶段决策过程的状态转移方程。有些问题的状态转移方程不一定存在数学表达式,但是它们的状态转移,还是有一定规律可循的。
第十页,讲稿共二十七页哦
6. 指标函数和最优解
指标函数是用来衡量策略效果的某种数量指标。对不同问题,指标函数可以是诸如费用、成本、产值、利润、产量、耗量、距离、时间、效用等等。
(1)阶段指标函数:用gk(sk,uk)表示第k段处于sk状态且所作决策为uk(sk)时的指标,它就是第k段指标函数,简记为gk 。
(2)过程指标函数(也称目标函数):用Rk(sk,uk)表示第k子过程的指标函数。如运输网络图的Rk(sk,uk)表示处于第k段sk状态且所作决策为uk时,从sk点到终点E的距离。由此可见,Rk(sk,uk)不仅跟当前状态sk有关,还跟该子过程策略pk(sk)有关,因此它是sk和pk(sk)的函数,应表示为:
第十一页,讲稿共二十七页哦
用fk(sk)表示第k子过程指标函数
在状态sk下的最优值,即
与它相应的子策略称为sk状态下的最优子策略,简记为:
特别当k=1且s1取值唯一时,f1(s1)就是问题的最优值,而p1*就是最优策略。
我们把最优策略和最优值统称为问题的最优解。
第十二页,讲稿共二十七页哦
综上所述,适于应用动态规划方法求解的一类多阶段决策问题,亦即具有无后效性的多阶段决策问题的数学模型呈以下形式:
(5)
模型说明对于给定的多阶段决策过程,求取一个最优策略(决策序列 ) ,使之既满足全部约束条件,又