文档介绍:第7章不完全信息与声誉
张维迎教授
北京大学光华管理学院
有限次博弈
第6章证明,只要未来足够重要,合作行为可以是无限次重复博弈的精炼纳什均衡。
但是,现实中许多博弈是有限次的,不是无限次的。
如果博弈重复的次数是有限的,无论重复多少次,合作都不会出现。
“连锁店悖论”(chain-store paradox)
Selten (1978);
进入者
在位者
进入
不进入
默许
斗争
(40,50)
(-10,0)
(0,100)
逆向归纳
假定在位者有20个市场。直观告诉我们,如果进入者在第一个市场进入,在位者应该选择斗争,因为尽管从一个市场看,斗争是不值得的,但这样做可以遏止进入者在其他市场上的进入。
唯一的精炼纳什均衡是:进入者总是进入;在位者总是默许。
Axelrod 实验
Axelrod(1981)实验表明:即使在有限次博弈中,合作行为也频繁出现。
问题在哪里?
一个可能的原因在于:我们前面假定不仅参与人的理性是共同知识,而且每个参与人可以选择的战略和效用函数都是共同知识。但现实不是这样。
可能性:逆向归纳方法的问题(理性共识);信息不完全;
正如我们前面讨论的谈判情况:如果信息是完全的,谈判一开始就达成协议,但现实中的谈判不是这样,原因在于信息不对称。
不完全信息
KMRW模型(1982);
如果参与人对其他参与人的效用函数和战略空间的信息不完全,即使博弈重复的次数是有限的,人们也有积极性建立一个合作的声誉(reputation),合作会出现。
单方不完全信息
假定有两个参与人,A和B,进行囚徒困境博弈。如下图。
参与人A有两中可能的类型:“非理性”型:只有一种战略,tit-for-tat (TFT),或者grim strategy, 概率为p; “理性”型:可以选择任何战略,概率为(1-p);
参与人B有一种类型:理性型。
对“非理性”的解释
特殊的成本函数或效用函数;
讲义气、重情谊的人;内在化了 reciprocity 社会规范的人;
认知问题;
囚徒困境博弈
合作
背叛
合作
背叛
3,3
-1,4
4,-1
0,0
A
B