1 / 10
文档名称:

随机动态规划.ppt

格式:ppt   大小:741KB   页数:10页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

随机动态规划.ppt

上传人:在水一方 2018/11/5 文件大小:741 KB

下载得到文件列表

随机动态规划.ppt

相关文档

文档介绍

文档介绍:1
动态规划 Dynamic Programming(DP)
动态规划在经济管理中的应用
随机动态规划简介
随机动态规划不同于确定型动态规划之处在于其下一阶段的状态不是由当前阶段的状态以及决策完全确定。确切地说,下一阶段的状态是什么,服从一个概率分布。不过,这个概率分布仍由当前阶段的状态以及决策完全确定。由此,我们得到随机动态规划的基本结构。下图给出了这种结构的形象描绘:
2
动态规划 Dynamic Programming(DP)
随机动态规划的基本结构图
sk
uk
s1k+1
sNk+1
s2k+1
opt
k+1阶段
p1
fk(sk)
k阶段
p2
pN

v1
v2
vN


fk+1( s1k+1 )
fk+1( s2k+1 )
fk+1( sNk+1 )
决策
uk  Dk(sk)
随机动态规划的基本方程:
fk(sk)= opt {  pi(vi+ fk+1( sik+1 ) )}
uk  Dk(sk)
i =1
N
fn(sn)= opt {  pivi }
un  Dn(sn)
i =1
N
k = n-1,…,2,1
3
动态规划 Dynamic Programming(DP)
某公司相信对一个开发项目进行投资会取得成功。若投资成功的话,公司就可以获得与投资数额相同的利润,若投资失败的话,公司非但得不到利润,就连投资也完全不能收回。公司对有关资料详细分析后认为,每次投资成功的概率为 2/3,失败的概率为 1/3。目前公司对此项目进行投资的总资金有 3 百万元,为了有效控制投资风险,公司计划分三次投入资金(如果有资金的话)。公司需要作出的决策是每次应投入多少资金(以百万元为单位),才能使三次投资结束后公司最终获得 2 百万元利润(即最终拥有 5 百万元总资金)的概率最大。
下面我们通过一个例子来具体阐述如何求解动态规划问题。请看案例——
4
动态规划 Dynamic Programming(DP)
1、阶段 k :第 k 次投资,k = 1,2,3
2、状态变量 sk :第 k 次投资时拥有可用于投资的资金数量。
3、决策变量 uk :第 k 次投资的资金数量。
决策集合 Dk(sk)= { uk | uk = 0,1,2,…, sk }
4、状态转移方程:
sk+1 =
sk + uk 第 k 次投资确实成功。
sk - uk 第 k 次投资确实失败。
5、定义阶段指标值(函数):
成功的概率为 2/3,失败的概率为 1/3。
5
动态规划 Dynamic Programming(DP)
6、定义fk( sk ):第 k 次投资时拥有可用于投资的资金数量 sk ,并一直投资到第 3 次投资结束后公司获得 2 百万元利润的最大概率。我们应该注意到这样一个事实——即使前两次投资失败了,公司仍然有机会最终赢得 2 百万元的利润。
7、随机动态规划的基本结构图:
sk
uk
sk- uk
sk+ uk
k+1阶段
fk(sk)
k阶段
fk+1( sk + uk )
决策
uk =0,1,…,sk
( )
max
fk+1( sk - uk )
成功,2/3
失败,1/3
6