文档介绍：第二章完全信息动态博弈
简单地讲,动态博弈就是参与者的行动选择必须
参与者的每一次行动选择叫做一步或一个时期.
直观地讲,动态博弈可以看作若干个静态博弈结
合在一起看作一个博弈.
动态博弈分为完美信息和非完美信息动态博弈.
是有先后顺序的博弈.
第二章完全信息动态博弈
的博弈.
参与者的收益函数是共同知识
2 完全且完美信息动态博弈:
博弈进行的每一步中
1 完全信息博弈:
要选择行动的参与者都知道这一步之前博弈进行的整个
过程.
3 完全但不完美信息博弈:
行动的参与者并不知道这一步之前博弈的整个过程
4 所有动态博弈的中心问题是可信任性.
在博弈的某些阶段, 要选择
由于过程十分重要,类似于对未来过程的了解,它
本身依赖于其它博弈方的行为. 那么就存在一个对其博弈方所可能采取策略的可信性问题.
可信任性:动态博弈中先行动的博弈方是否应该相
信后行动博弈方会采取某种策略或行为.
后行为博弈方将来采取对先行动博弈方有利的行为为“许诺”,采取对先行动方不利的行为为“威胁”.
第一,参与者1选择支付1000 美元给参与者2,
是否引爆一颗手雷.
看下例,这是一个两步博弈.
或者一分不给;
第二,参与者2观察到参与者1的选择,然后决定
两个参与者如何选择呢?
如果参与者1相信这一威胁,
他的最优反应是支付
1000美元给参与者2,
但参与者1却不会对这一威胁信以为真,
它不可置信.
参与者2 接受,博弈结束.
完全且完美信息动态博弈
一、动态博弈的表述(初步描述)
1、基本要求
(1)局中人 I={ 1,2,…, n }
(2)局中人的行动次序(有先后之分),Ai 为i
的行动集.
(3)每次行动时局中人所进行的选择
(4)外生事件的概率分布
(5)局中人在选择行动时所了解的信息
(6)支付函数
二、动态博弈的表示方法和特点
1、动态博弈的阶段和扩展形表示
动态博弈中一个博弈方的一次行动选择称为一个
“阶段”(Stage).
动态博弈也称为“序列博弈”(Sequential Games)
序和博弈的阶段,因此是表示(阶段数和博弈方可选
由于扩展形可以反映动态博弈中博弈方的选择次
行为数量较少的)动态博弈的最佳方法. 动态博弈有
时也被称为“扩展形博弈”(Extensive FormGame).
而且每个阶段的可能选择也很多,因此很难用扩展形
注意:并不是所有动态博弈都可以用扩展形表示.
例如下象棋是动态博弈,但因为它不仅博弈阶段很多,
式加以表示.
三、动态博弈的基本特点
分,而且一个博弈方的选择很可能不是只有一次,而
在动态博弈中,各个博弈方的选择不仅有先后之
是有几次,并且在不同阶段的多次行为之间有内在联
系,是不能分割的整体.
因此在动态博弈中,研究某
个博弈方某个阶段的行为,
裂开来研究是没有意义的.
或者将各个阶段的行为割
动态博弈中某博弈方的策略
是指轮到他选择时,
针对前面阶段的各种情况,以及后续阶段可能的选择
所作相应选择的完整计划.
动态博弈的结果
包括双方(或多方)采用的策略
组合、实现的博路径和各博弈方的收益.
四、动态博弈的非对称性
因为动态博弈中各个博弈方的行为选择有先后次
序的,且后行为者能观察到此前博弈方的行为选择,
因此动态博弈中各博弈方的地位是不对称的. 另外,在
动态博弈中各博弈方的阶段选择不一定是交替进行的.
A
B
A
B
制止
(-2,5)
不仿冒
(0,10)
不仿冒
仿冒
制止
不制止
仿冒
(2,2)
(10,4)
(5,5)
不制止
博弈树(扩展型示意)例:仿冒博弈
五、完全且完美信息动态博弈解法之逆向归纳法
1、二人动态博弈的逆向归纳法
I ={1 ,2},局中人1先行动,2根据1的行动选择行动
收益函数
局中人2 的选择
(2对1的反应函数)
局中人1知道2 会根据1的选择而做出选择
局中人1的选择:
从而得到这一动态博弈的逆向递归解
2·1 完全且完美信息动态博弈
2·1· A 理论:逆向归纳法
手雷博弈属于下面简单类型的完全且完美信息
动态博弈:
1 参与者1 从可行集A1中选择一个行动a1,
2 参与者2观察到a1后,从可行集A2中选择一个
行动a1,
3 两人的收益分别为和
逆向归纳法求解此博弈如下:
在博弈的第二阶段参与者2行动时,由于其前参
与者1已选择行动a1,他面临的决策问题可用下式表
示为
假定对A1中的每一个a1,参与者2的最优化问题
只有唯一解, 用R2(a1) 表示. 由于参与者1能和参与
者2 一样解出2 的问题,参与者1可