文档介绍:动态博弈
•行动有先后顺序,不同的参与人在不同时点行
第四章动,先行动者的选择影响后行动者的选择空
动态博弈与承诺间,后行动者可以观察到先行动者做了什么选
择,因此,为了做出最优的行动选择,每个参
与人都必须这样思考问题:如果我如此选择,
张维迎对方将如何应对?如果我是他,我将会如何行
北京大学光华管理学院动?给定他的应对,什么是我的最优选择?
•如下棋
博弈树(game tree) 动态博弈中的战略
(-1,-1)
进入•战略是一个完备的行动计划:在博弈开
B
始之前就规定出每一个决策点上的选
进入
不进入择,即使这个决策点实际上不会出现。
A (1, 0)
•考虑老师与学生之间考试之后的一个博
弈:老师先行动(判分),学生后行动
不进入 B 进入(0, 1)
(在不同分数下如何应对)。假定学生
的实际成绩是不及格。
不进入
(0, 0)
战略表式下的纳什均衡三个纳什均衡
学生•(及格;A,F);(不及格;F,A);
A,FF,AA,AF,F (不及格;A,A)
及格•问题:哪一个会出现呢?
-1,1 -10,-10 -1,1 -10,-10
老师
不及格
-10,-10 1,-1 1,-1 -10,-10
不可置信的威胁(noncredible threat) 精炼纳什均衡(Perfect NE)
•在(及格;A,F)和(不及格;F,A)中, •不包含不可置信的行动的战略所组成的纳什均
学生“报复(F)”的威胁是不可信的:无论老衡被称为“精炼纳什均衡”;也就是说,不论过
师判“及格”还是“不及格”,“报复”不是学生的去发生了什么,构成精炼纳什均衡的战略,其
最优选择; 所规定的行动在每一个决策点上都是最优的。
•事前(ex ante)和事后(ex post):一种战略所规所以,又称为“序惯均衡”(sequential
定的行动在事前看来是最优的,但事后看并不 equilibrium);
是当事人的最优选择,这种行动就不可置信, •首先必须是“纳什均衡”,但并非所有纳什均衡
该战略就不是一个合理的战略。都是合理的;只有其战略不包含不可置信行动
的纳什均衡才是合理的。
子博弈(subgame) 子博弈精炼纳什均衡
•由原博弈中某个决策点(信息集)开始•精炼纳什均衡:(1)在原博弈是一个纳
的部分构成一个子博弈。什均衡;(2)在每一个子博弈上都是纳
2 什均衡。
23
1 •考试博弈:
3 –(及格;A,F)在第二个子博弈上不构成纳什均
衡;
原博弈子博弈I 子博弈II –(不及格;F,A)在第一个子博弈不构成纳什均
衡;
–(不及格;A,A)在所有子博弈上都构成纳什均
衡。
考试博弈
逆向归纳法(backward induction)
(-10,-10)
报复•在有限博弈中,我们可以用逆向归纳法
学生求解精炼纳什均衡:从最后一个决策点
及格
接受开始,找出该子博弈的纳什均衡;然后
(-1, 1)
老师再倒回到倒数第二个决策点,找出决策
者的最优决策(假定最后一个决策者的
不及格学生报复(-10, -1