文档名称：

算法合集之《动态规划》.doc

格式：doc 页数：11页

下载后只包含 1 个 DOC 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

算法合集之《动态规划》.doc

上传人:xxj16588 2016/6/7 文件大小：0 KB

下载得到文件列表

算法合集之《动态规划》.doc

相关文档

文档介绍

文档介绍：动态规划关健字:阶段状态决策函数递推式摘要: 动态规划是解决多阶段决策最优化问题的一种思想方法。所谓“动态”,指的是在问题的多阶段决策中,按某一顺序,根据每一步所选决策的不同,将随即引起状态的转移,最终在变化的状态中产生一个决策序列。动态规划就是为了使产生的决策序列在符合某种条件下达到最优。动态规划思想近来在各类型信息学竞赛中频繁出现,它的应用也越来越受人重视。本文就是讨论如何运用动态规划的思想设计出有效的数学模型来解决问题一动态规划问题的数学描述我们先来看一个简单的多阶段决策问题。[例1]现有一张地图,各结点代表城市,两结点间连线代表道路,线上数字表示城市间的距离。如图 1所示,试找出从结点 1到结点 10的最短路径。第一阶段第二阶段第三阶段第四阶段第五阶段图1 本问题的解决可采用一般的穷举法,即把从结点 1 至结点 10 的所有道路列举出来,计算其长度,再进行比较,找出最小的一条。虽然问题能解决,但采用这种方法,当结点数增加,其运算量将成指数级增长,故而效率是很低的。分析图 1可知,各结点的排列特征: (1) 可将各结点分为 5个阶段; (2) 每个阶段上的结点只跟相邻阶段的结点相连,不会出现跨阶段或同阶段结点相连的情况,如不会出现结点 1与结点 4连、结点 4与结点 5连的情况。(3) 除起点 1 和终点 10 外,其它各阶段的结点既是上一阶段的终点,又是下一阶段的起点。例如第三阶段的结点 4、5、6 ,它即是上一阶段结点 2、3中某结点的终点,又是下一阶段结点 7、8、9中某结点的起点。根据如上特征,若对于第三阶段的结点 5,选择 1-2-5 和1-3-5 这两条路径, 后者的费用要小于前者。那么考虑一下,假设在所求的结点 1 到结点 10 最短路径中要经过结点 5,那我们在结点 1到结点 5之间会取那条路径呢?显然,无论从结点 5出发以后的走法如何,前面选择 1-3-5 这条路都总是会优于 1-2-5 的。也就是说,当某阶段结点一定时,后面各阶段路线的发展不受这点以前各阶段的影响。反之,到该点的最优决策也不受该点以后的发展影响。由此,我们可以把原题所求分割成几个小问题,从阶段 1 开始,往后依次求出结点 1 到阶段 2、3、4、5 各结点的最短距离,最终得出答案。在计算过程中,到某阶段上一结点的决策,只依赖于上一阶段的计算结果,与其它无关。例如,已求得从结点 1 到结点 5 的最优值是 6 ,到结点 6 的最优值是 5 ,那么要求到下一阶段的结点 8 的最优值,只须比较 min{6+5, 5+5} 即可。这样,运用动态规划思想大大节省了计算量。可以看出,动态规划是解决此类多阶段决策问题的一种有效方法。二动态规划中的主要概念,名词术语 1阶段:把问题分成几个相互联系的有顺序的几个环节,这些环节即称为阶段。 2状态:某一阶段的出发位置称为状态。通常一个阶段包含若干状态。如图 1中,阶段 3就有三个状态结点 4、5、6。 3决策:从某阶段的一个状态演变到下一个阶段某状态的选择。 4策略:由开始到终点的全过程中,由每段决策组成的决策序列称为全过程策略,简称策略。 5状态转移方程:前一阶段的终点就是后一阶段的起点,前一阶段的决策选择导出了后一阶段的状态,这种关系描述了由k阶段到k+1阶段状态的演变规律, 称为状态转移方程。 6目标函数与最优化概念:目标函数是衡量多阶段决策过程优劣的准则。最优化概念是在一定条件下找到一个途径,经过按题目具体性质所确定的运算以后,使全过程的总效益达到最优。三运用动态规划需符合的条件任何思想方法都有一定的局限性,超出了特定条件,它就失去了作用。同理, 动态规划也并不是万能的。那么使用动态规划必须符合什么条件呢?必须满足最优化原理和无后效性。 1最优化原理最优化原理可这样阐述:一个最优化策略具有这样的性质,不论过去状图2 态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。如图 2中,若路线 I和J是A到C的最优路径,则根据最优化原理,路线 J 必是从 B到C的最优路线。这可用反证法证明:假设有另一路径 J’是B到C的最优路径,则A到C的路线取 I和J’比I和J更优,这与原名题矛盾。从而证明 J’必是 B到C的最优路径。最优化原理是动态规划的基础,任何问题,如果失去了最优化原理的支持, 就不可能用动态规划方法计算。 2无后效性“过去的步骤只能通过当前状态影响未来的发展,当前的状态是历史的总结”。这条特征说明动态规划只适用于解决当前决策与过去状态无关的问题。状态,出现在策略任何一个位置,它的地位相同,都可实施同样策略,这就是无后效性的内涵。由上可知,最优化原理,无后效性,是动态规划必须符合的两个条件。四动态规划的计算方法对于一道题,怎样具