文档介绍:3完全但不完美信息博弈:,要选择由于过程十分重要,类似于对未来过程的了解,:“许诺”,采取对先行动方不利的行为为“威胁”.第一,参与者1选择支付1000美元给参与者2,,;第二,参与者2观察到参与者1的选择,然后决定两个参与者如何选择呢?如果参与者1相信这一威胁,他的最优反应是支付1000美元给参与者2,但参与者1却不会对这一威胁信以为真,,、动态博弈的表述(初步描述)1、基本要求(1)局中人I={1,2,…,n}(2)局中人的行动次序(有先后之分),Ai为i的行动集.(3)每次行动时局中人所进行的选择(4)外生事件的概率分布(5)局中人在选择行动时所了解的信息(6)支付函数二、动态博弈的表示方法和特点1、动态博弈的阶段和扩展形表示动态博弈中一个博弈方的一次行动选择称为一个“阶段”(Stage).动态博弈也称为“序列博弈”(SequentialGames)序和博弈的阶段,因此是表示(阶段数和博弈方可选由于扩展形可以反映动态博弈中博弈方的选择次行为数量较少的)“扩展形博弈”(ExtensiveFormGame).而且每个阶段的可能选择也很多,因此很难用扩展形注意:,但因为它不仅博弈阶段很多,、动态博弈的基本特点分,而且一个博弈方的选择很可能不是只有一次,而在动态博弈中,各个博弈方的选择不仅有先后之是有几次,并且在不同阶段的多次行为之间有内在联系,,研究某个博弈方某个阶段的行为,,针对前面阶段的各种情况,(或多方)采用的策略组合、、动态博弈的非对称性因为动态博弈中各个博弈方的行为选择有先后次序的,且后行为者能观察到此前博弈方的行为选择,,(-2,5)不仿冒(0,10)不仿冒仿冒制止不制止仿冒(2,2)(10,4)(5,5)不制止博弈树(扩展型示意)例:仿冒博弈五、完全且完美信息动态博弈解法之逆向归纳法1、二人动态博弈的逆向归纳法I={1,2},局中人1先行动,2根据1的行动选择行动收益函数局中人2的选择(2对1的反应函数)局中人1知道2会根据1的选择而做出选择局中人1的选择:从而得到这一动态博弈的逆向递归解2·1完全且完美信息动态博弈2·1·A理论:逆向归纳法手雷博弈属于下面简单类型的完全且完美信息动态博弈:1参与者1从可行集A1中选择一个行动a1,2参与者2观察到a1后,从可行集A2中选择一个行动a1,3两人的收益分别为和逆向归纳法求解此博弈如下:在博弈的第二阶段参与者2行动时,由于其前参与者1已选择行动a1,他面临的决策问题可用下式表示为假定对A1中的每一个a1,参与者2的最优化问题只有唯一解,用R2(a1),参与者1可以预测到参与者2对每一个可能行动a1所做出的反应,这样1在第一阶段要解决的问题可归结为:假定参与者1的这一最优化问题也有唯一解,表示为,:因为参与者1能够预测到参与者2对1的可能选择的最优反应,.(2,0)(1,1)121LRL1R1R2L2(3,0)(0,2)博弈的解或博弈的结果:参与者选择L,(L,X).