文档介绍:有限次博弈
第章证明,只要未来足够重要,合作行
第章• 6
7 为可以是无限次重复博弈的精炼纳什均
不完全信息与声誉衡。
•但是,现实中许多博弈是有限次的,不
张维迎教授是无限次的。
北京大学光华管理学院•如果博弈重复的次数是有限的,无论重
复多少次,合作都不会出现。
“连锁店悖论”(chain-store paradox) 逆向归纳
• Selten (1978); •假定在位者有20个市场。直观告诉我
(40,50)
默许们,如果进入者在第一个市场进入,在
在位者位者应该选择斗争,因为尽管从一个市
进入场看,斗争是不值得的,但这样做可以
斗争
进入者(-10,0) 遏止进入者在其他市场上的进入。
不进入•唯一的精炼纳什均衡是:进入者总是进
(0,100) 入;在位者总是默许。
Axelrod 实验问题在哪里?
• Axelrod(1981)实验表明:即使在有限•一个可能的原因在于:我们前面假定不仅参与
次博弈中,合作行为也频繁出现。人的理性是共同知识,而且每个参与人可以选
择的战略和效用函数都是共同知识。但现实不
是这样。
•可能性:逆向归纳方法的问题(理性共识);
信息不完全;
•正如我们前面讨论的谈判情况:如果信息是完
全的,谈判一开始就达成协议,但现实中的谈
判不是这样,原因在于信息不对称。
不完全信息单方不完全信息
•KMRW模型(1982); •假定有两个参与人,A和B,进行囚徒困
•如果参与人对其他参与人的效用函数和境博弈。如下图。
战略空间的信息不完全,即使博弈重复•参与人A有两种可能的类型:“非理性”
的次数是有限的,人们也有积极性建立型:只有一种战略,tit-for-tat (TFT),或
一个合作的声誉(reputation),合作会出者grim strategy, 概率为p;“理性”型:可
现。以选择任何战略,概率为(1-p);
•参与人B有一种类型:理性型。
对“非理性”的解释囚徒困境博弈
•特殊的成本函数或效用函数; B
•讲义气、重情谊的人;内在化了合作背叛
reciprocity 社会规范的人; 合作
, ,
•认知问题; 3 3-14
A
背叛
4,-1 0,0
博弈重复两次第2阶段
参与人:如果是理性的,选择背叛;
t=1 t=2 • A “”
如果是非理性的,选择B在第1阶段的行
非理性(p) 合作 X 动(X);
A •参与人B:选择“背叛”。
理性型(1-p) 背叛背叛
B (理性型) X 背叛
第1阶段 B在第2阶段的选择
•参与人A:如果是非理性的,选择“合•选择合作,期望效用是:
作”;如果是理性的,选择“背叛”; • 3p+(-1)(1-p)+4p+0(1-p)=8p-1
•参与人B:如果选择合作,面临被背叛的•如果选择背叛,期望效用函数是:
风险,但如果是非理性的,可以换来第
A • 4p+0(1-p)+0=4p
2阶段的合作。
•最优选择是合作,如果:p>=;
•结论:如果B认为A非理性的概率不小于
, B在第1阶段会选择合作,即使博弈
只重复两次。