文档介绍:2 完全信息的动态博弈
完全和完美信息的动态博弈
动态博弈(dynamic game):参与人在不同的时间选择行动。
完全信息动态博弈指的是各博弈方先后行动,后行动者知道 先行动者的具体行动是什么且各博弈方对博弈中各种策略组合道前决策者的选择,后决策者可以出现在后面,也可以 出现在前面。
相同的博弈可以不同的博弈树表示,但同一个参与人在代表同一
博弈的不同博弈树中的信息集的数量必须相同,自然除外。
博弈一般假定满足完美回忆的要求,完美回忆是指没有参与人会忘记
自己以前知道的事情,所有参与人都知道自己以前的选择。
确保博弈具有完美回忆的要求:如果⑪2和兀1属于同一信息集;②T 是x1的前列结;③X和X1都是同一个参与人的决策结;那么,存在 一个Xr(可能是X本身)满足:®xrr和X属于同一信息集;®xrr 是X2的前列结;③从X到达X1的行动和X”到达X2的行动是一样的。
当博弈涉及到外生不确定性事件时,我们假定“自然”以某种概率选 择某个特定事件,所有参与人对于自然的选择具有相同的先验概率。 即所谓的“海萨尼公理”。
纳什均衡:(进入、(默许、默许))
(不进入、(斗争、斗争)
(进入、(默许、斗争))
(不进入、(斗争、默许)
均衡结果有三个(进入,默许)、(不进入,斗争)、(不进入、默许) 定理:一个有限完美信息博弈有一个纯战略纳什均衡(zermelo,1913; kuhn,1953)。
策略的可置信性问题:策略是博弈方自己预先设定的,在各个博弈阶 段针对各种情况所作的相应行为选择的计划,本身没有强制力,且实 施起来有一个过程。在该过程中,根据自己的利益需要,他完全可以 改变这个计划,从而存在“相机选择”,产生策略的可置信性问题。
A 子博弈精炼纳什均衡、逆向归纳法
“子博弈精炼纳什均衡 (subgame perfect Nash equilibrium, selten, 1965),用于区分动态博弈中的“合理纳什均衡”与“不合理 纳什均衡”,将纳什均衡中包含有不可置信威胁策略的均衡剔除出去, 就是说,使最后的均衡中不再包含有不可置信威胁策略的存在。
子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x 开始的与所有该决策结的后续结 (包括终点结)组成的能自成一个博 弈的原博弈的一部分。要求:①x是一个单结信息集;②子博弈的信 息集和支付向量都直接继承自原博弈;③子博弈不能切割原博弈的信 息集。
任何博弈本身称为其自身的子博弈。
扩展式博弈的战略组合s*= (s*[,…,S*.,・・・,s* )是一个子博弈精
1 i n
炼纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每一个子 博弈上给出纳什均衡。简单的讲,一个战略组合是子博弈精炼纳什均 衡,当且仅当他在每一个子博弈(包括原博弈)上都构成一个纳什均 衡。如果整个博弈是唯一的子博弈,那么纳什均衡与子博弈精炼纳什 均衡相同,如果有其它子博弈,则有些纳什均衡可能不构成子博弈精 炼纳什均衡。
开发 不开发
开发/
\不开盘
\
/
⑴门)
<)
(c)-pnv 弈 II
-3,-3
—3. —3
],0
丄卫
0^1
0^0
0,1
开发商B
(开发,{不开发,开发})是唯一一个子博弈精炼纳什均衡
均衡路径(equilibrum path):纳什均衡所在的路径。其它的路径都 是该纳什均衡的非均衡路径( off-equilibrium path)。
构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的,而且在 非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实 质区别。
只有当一个战略规定的行动规则在所有可能的情况下都是最优的时, 它才是一个合理的、可置信的战略。
序贯理性(sequential rationality):不论过去发生了什么,参与人应 该在博弈的每一个时点上最优化自己的决策。
子博弈精炼纳什均衡求法——逆向归纳法求解
对于我们现在所讨论的有限完美信息动态博弈,逆向归纳法是求解子 博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从 最后一个子博弈开始逆推上去,这就是逆向归纳法。所以逆向归纳法 就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒 推以求解动态博弈均衡的方法。逆向归纳法是重复剔出劣战略方法在 扩展式博弈中的应用。
逆向归纳法不适合于无限博弈和不完美信息博弈。
简单的完全和完美信息博弈:
参与人 1 选择行动 a1
参与人2观察叫,然后选择a2
收益是 w1(a ], a2)和 u2(a1? a2)
求解博弈: 逆向归