1 / 35
文档名称:

第四章 动态规划.doc

格式:doc   页数:35
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第四章 动态规划.doc

上传人:Hkatfwsx 2014/8/10 文件大小:0 KB

下载得到文件列表

第四章 动态规划.doc

文档介绍

文档介绍:第四章动态规划
第四章动态规划
§1 引言
13>.1 动态规划的发展及研究内容
动态规划(dynamic programming)是运筹学的一个分支,是求解多阶段决策问题的最优化方法。20世纪50年代初R. E. Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优性原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法—动态规划。1957年出版了他的名著《Dynamic Programming》,这是该领域的第一本著作。
动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。
虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。
应指出,动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种特殊算法(如线性规划是一种算法)。因而,它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,而必须对具体问题进行具体分析处理。因此,在学习时,除了要对基本概念和方法正确理解外,应以丰富的想象力去建立模型,用创造性的技巧去求解。
例1 最短路线问题
下面是一个线路网,连线上的数字表示两点之间的距离(或费用)。试寻求一条由到距离最短(或费用最省)的路线。
例2 生产计划问题
工厂生产某种产品,每单位(千件)的成本为1(千元),每次开工的固定成本为9>3(千元),工厂每季度的最大生产能力为6(千件)。经调查,市场对该产品的需求量第一、二、三、四季度分别为2,3,2,4(千件)。如果工厂在第一、二季度将全年的需求都生产出来,自然可以降低成本(少付固定成本费),但是对于第三、四季度才能上市的产品需付存储费,(千元)。还规定年初和年末这种产品均无库存。试制定一个生产计划,即安排每个季度的产量,使一年的总费用(生产成本和存储费)最少。
决策过程的分类
根据过程的时间变量是离散的还是连续的,分为离散时间决策过程(discrete-time decision process)和连续时间决策过程(continuous-time decision process);根据过程的演变是确定的还是随机的,分为确定性决策过程(deterministic decision process)和随机性决策过程(stochastic decision process),其中应用最广的是确定性多阶段决策过程。
§2 基本概念、基本方程和计算方法
动态规划的基本概念和基本方程
一个多阶段决策过程最优化问题的动态规划模型通常包含以下要素。
阶段
阶段(step)是对整个过程的自然划分。通常根据时间顺序或空间顺序特征来划分阶段,以便按阶段的次序解优化问题。阶段变量一般用表示。在例1中由出发为,由出发为,依此下去从出发为,共个阶段。在例2中按照第一、二、三、四季度分为,共四个阶段。
状态
状态(state)表示每个阶段开始时过程所处的自然状况。它应能描述过程的特征并且无后效性,即当某阶段的状态变量给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关。通常还要求状态是直接或间接可以观测的。
描述状态的变量称状态变量(state variable)。变量允许取值的范围称允许状态集合(set of admissible states)。用表示第阶段的状态变量,它可以是一个数或一个向量。用表示第阶段的允许状态集合。在例1中可取,或将定义为,则或,而。
个阶段的决策过程有个状态变量,表示演变的结果。在例1中取,或定义为,即。
根据过程演变的具体情况,状态变量可以是离散的或连续的。为了计算的方便有时将连续变量离散化;为了分析的方便有时又将离散变量视为连续的。
状态变量简称为状态。
决策
当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决策(decision),在最优控制问题中也称为控制(control)。
描述决策的变量称决策变量(decision variable),变量允许取值的范围称允许决策集合(set of admissible decisions)。用表示第阶段处于状态时的决策变量,它是的函数,用表示的允许决策集合。在例1中可取或,可记作,而。
决策变量简称决策。

最近更新

2026年大学c语言考试题库及答案(夺冠) 14页

2026年干部廉政知识试题(黄金题型) 14页

基于主动学习Kriging的航空发动机机构可靠性分.. 7页

2026年西安高新科技职业学院单招职业技能测试.. 44页

基于一种可切换亲水溶剂辅助提取黄曲霉毒素 31页

2025年黄山太平经济开发区投资有限公司公开招.. 44页

2025青海黄南州同仁市司法局面向全市招录1人考.. 46页

2026年c语言上机期末考试题1套 13页

2026年c语言指针考试题库标准卷 13页

2026年c语言理论考试题(含答案) 13页

2026年c语言试题期末(必刷) 13页

2024年上海交通职业技术学院辅导员招聘考试真.. 36页

2024年北京服装学院辅导员考试参考题库最新 37页

2026年云南锡业职业技术学院单招职业适应性测.. 44页

2024年江西航空职业技术学院马克思主义基本原.. 22页

2026年全国二级计算机C语言程序设计题库(精练.. 13页

2025中国邮政集团有限公司云南省分公司见习人.. 32页

2026年北海康养职业学院单招职业技能考试模拟.. 44页

2025年吉林财经大学马克思主义基本原理概论期.. 13页

2025年宣城职业技术学院单招职业倾向性考试题.. 43页

2025年武威职业学院单招职业倾向性考试题库带.. 43页

2026年安徽城市管理职业学院单招职业适应性考.. 37页

2025年湖南省建设工程工程量清单计价办法(新).. 51页

2025年江西信息应用职业技术学院单招职业适应.. 127页

2025年江西信息应用职业技术学院单招职业倾向.. 73页

喝酒给老婆的检讨书 6页

vae乳液低温发泡工艺 29页

《口蹄疫》ppt课件 42页

自然条件对城市的影响 48页

DL T 5783-2019《水电水利地下工程地质超前预.. 36页