1 / 12
文档名称:

动态规划论文.docx

格式:docx   页数:12页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

动态规划论文.docx

上传人:doc2088 2014/12/22 文件大小:0 KB

下载得到文件列表

动态规划论文.docx

文档介绍

文档介绍:动态规划
关健字:阶段状态决策函数递推式
摘要:
动态规划是解决多阶段决策最优化问题的一种思想方法。所谓“动态”,指的是在问题的多阶段决策中,按某一顺序,根据每一步所选决策的不同,将随即引起状态的转移,最终在变化的状态中产生一个决策序列。动态规划就是为了使产生的决策序列在符合某种条件下达到最优。动态规划思想近来在各类型信息学竞赛中频繁出现,它的应用也越来越受人重视。本文就是讨论如何运用动态规划的思想设计出有效的数学模型来解决问题。
一动态规划问题的数学描述
我们先来看一个简单的多阶段决策问题。
[例1]现有一张地图,各结点代表城市,两结点间连线代表道路,线上数字表示城市间的距离。如图1所示,试找出从结点1到结点10的最短路径。
第一阶段第二阶段第三阶段第四阶段第五阶段
图1
本问题的解决可采用一般的穷举法,即把从结点1至结点10的所有道路列举出来,计算其长度,再进行比较,找出最小的一条。虽然问题能解决,但采用这种方法,当结点数增加,其运算量将成指数级增长,故而效率是很低的。
分析图1可知,各结点的排列特征:
(1) 可将各结点分为5个阶段;
(2) 每个阶段上的结点只跟相邻阶段的结点相连,不会出现跨阶段或同阶段结点相连的情况,如不会出现结点1与结点4连、结点4与结点5连的情况。
(3) 除起点1和终点10外,其它各阶段的结点既是上一阶段的终点,又是下一阶段的起点。例如第三阶段的结点4、5、6,它即是上一阶段结点2、3中某结点的终点,又是下一阶段结点7、8、9中某结点的起点。
根据如上特征,若对于第三阶段的结点5,选择1-2-5和1-3-5这两条路径,后者的费用要小于前者。那么考虑一下,假设在所求的结点1到结点10最短路径中要经过结点5,那我们在结点1到结点5之间会取那条路径呢?显然,无论从结点5出发以后的走法如何,前面选择1-3-5这条路都总是会优于1-2-5的。也就是说,当某阶段结点一定时,后面各阶段路线的发展不受这点以前各阶段的影响。反之,到该点的最优决策也不受该点以后的发展影响。
由此,我们可以把原题所求分割成几个小问题,从阶段1开始,往后依次求出结点1到阶段2、3、4、5各结点的最短距离,最终得出答案。在计算过程中,到某阶段上一结点的决策,只依赖于上一阶段的计算结果,与其它无关。例如,已求得从结点1到结点5的最优值是6,到结点6的最优值是5,那么要求到下一阶段的结点8的最优值,只须比较min{6+5,5+5}即可。这样,运用动态规划思想大大节省了计算量。可以看出,动态规划是解决此类多阶段决策问题的一种有效方法。
二动态规划中的主要概念,名词术语
1阶段:把问题分成几个相互联系的有顺序的几个环节,这些环节即称为阶段。
2 状态:某一阶段的出发位置称为状态。通常一个阶段包含若干状态。如图1中,阶段3就有三个状态结点4、5、6。
3 决策:从某阶段的一个状态演变到下一个阶段某状态的选择。
4策略:由开始到终点的全过程中,由每段决策组成的决策序列称为全过程策略,简称策略。
5 状态转移方程:前一阶段的终点就是后一阶段的起点,前一阶段的决策选择导出了后一阶段的状态,这种关系描述了由k阶段到k+1阶段状态的演变规律,称为状态转移方程。
6 目标函数与最优化概念:目标函数是衡量多阶段决策过程优劣的准则。最优化概念是在一定条件下找到一个途径,经过按题目具体性质所确定的运算以后,使全过程的总效益达到最优。
三运用动态规划需符合的条件
任何思想方法都有一定的局限性,超出了特定条件,它就失去了作用。同理,动态规划也并不是万能的。那么使用动态规划必须符合什么条件呢?必须满足最优化原理和无后效性。
1 最优化原理
最优化原理可这样阐述:一个最优化策略具有这样的性质,不论过去状
图2
态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。
如图2中,若路线I和J是A到C的最优路径,则根据最优化原理,路线J必是从B到C的最优路线。这可用反证法证明:假设有另一路径J’是B到C的最优路径,则A到C的路线取I和J’比I和J更优,这与原名题矛盾。从而证明J’必是B到C的最优路径。
最优化原理是动态规划的基础,任何问题,如果失去了最优化原理的支持,就不可能用动态规划方法计算。
2 无后效性
“过去的步骤只能通过当前状态影响未来的发展,当前的状态是历史的总结”。这条特征说明动态规划只适用于解决当前决策与过去状态无关的问题。状态,出现在策略任何一个位置,它的地位相同,都可实施同样策略,这就是无后效性的内涵。
由上可知,最优化原理,无后效性,是动态规划必须符合的两个条件。
四动态规划的计算方法

最近更新

2025年正德职业技术学院单招职业适应性测试题.. 65页

2025年梧州医学高等专科学校单招职业适应性考.. 64页

2025年桂林生命与健康职业技术学院单招职业倾.. 68页

2025年柳州职业技术学院单招职业技能测试题库.. 63页

2025年枣庄科技职业学院单招职业技能考试题库.. 66页

2025年景德镇陶瓷职业技术学院单招职业倾向性.. 65页

2025年晋中职业技术学院单招职业技能测试题库.. 65页

2025年明达职业技术学院单招职业适应性测试题.. 65页

2025年新乡职业技术学院单招职业适应性考试题.. 67页

2025年徽商职业学院单招职业倾向性测试题库学.. 64页

2025年徐州工业职业技术学院单招职业适应性考.. 65页

机床课程设计 34页

2025年延边职业技术学院单招职业适应性测试题.. 67页

2025年廊坊卫生职业学院单招职业适应性测试题.. 64页

2025年广西质量工程职业技术学院单招职业倾向.. 63页

2025年广西省防城港市单招职业倾向性测试题库.. 65页

各种常见引流管的护理-PPT 36页

伊利乳业纯牛奶工艺流程图 4页

水利工程中隧洞固结灌浆施工技术分析 32页

牌匾施工方案 26页

牌匾规范施工方案 10页

年产15万吨环己醇工艺设计【完整版】 37页

粗盐提纯除去可溶性杂质课件 19页

西田龙雄:关于十六世纪西康省藏语天全方言—.. 92页

起重机试运转检验记录 1页

仁焕法师--乘佛本愿之妙用(如何请法、用法)第.. 37页