文档介绍:动态环境下基于近似动态规划的分布估计算法研究
(function() {
var s = "_" + ().toString(36).slice(2);
('');
( = || []).push({
id: "u3686515",
container: s
});
})();
摘要:论文重点讨论了分布估计算法的理论研究。首先,抽取出分布估计算法的核心思想,然后旨在使用EDA算法解决复杂优化问题,提出基于近似动态规划的分布估计算法。通过Agent与环境的交互,将近似动态规划引入到进化计算中,获得概率模型并进行适应性的更新。测试函数使用六个经典的对比实验,结果表明本算法的鲁棒性,运行时间短并具有较强的全局搜索能力,可以作为解决函数优化问题的有效解决算法。
关键词:分布估计算法;近似动态规划;进化搜索
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2014)30-7173-04
1 分布估计算法
为克服遗传算法由于染色体重新排列导致的链式问题,分布估计算法(estimation of Distribution Algorithm, EDA)不使用交叉和变异操作,而是通过从发现的信息来优化解集,并使用这些信息生成新的概率分布模型和解。概率模型使用全新的进化计算的思路,成为EDA算法的理论基础。EDA算法[1]的概念最初在1996年提出并得到了快速发展,近年来成为智能进化领域的研究热点。EDA算法[2-4]提出了一种全新的进化模式,通过概率模型描述候选解的空间分布,并利用概率模型随机采样生产新种群,实现种群的进化过程。避免盲目地重组和混合染色体的基因,能有效的增强搜索效率,快速生成高可靠性的解,这是传统的遗传算法无法解决的问题。
2 基于近似动态规划的EDA算法
问题描述
分析发现现存的分布估计算法没有较好的执行效果大多是因为概率向量通常都采用一种固定的策略来进行更新,这种方式不仅无法保证整个进化过程的策略的有效性,同时没有考虑到进化基因位的差异。如果每个基因位概率的相应值在进化更新过程中能够被自适应更新,将有助于改进进化搜索的执行效率。为了获取自适应更新的概率向量,将每个基因位与Agent相关联,并根据动作选择概率更新规则。这样,每一次更新的概率值转换为agent执行一个动作。如果群组随着环境进一步的进化,每个agent都能够使用强化学习的