文档介绍:第6章重复博弈与合作行为
张维迎教授
北京大学光华管理学院
序惯博弈与重复博弈
序惯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次;
重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈”(stage game).
重复博弈的三个特征
阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构;
所有参与人观察到博弈过去的历史;
参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和;
重复博弈和信誉问题
如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。
重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。
囚徒困境博弈
合作
不合作
合作
不合作
3,3
-1,4
4,-1
0,0
A
B
重复博弈与战略空间的扩展
假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例:
All-D: 不论过去什么发生,总是选择不合作;
All-C: 不论过去什么发生,总是选择合作;
合作-不合作交替进行;
tit-for-tat: 从合作开始,之后每次选择对方前一阶段的行动;
trigger strategies: 从合作开始,一直到有一方不合作,然后永远选择不合作。
“囚徒困境”的一般表示
合作
不合作
合作
不合作
T,T
S,R
R,S
P,P
满足:R>T>P>S; (S+R)<T+T
支付函数
双方都不合作:
对的解释:
贴现率;
博弈继续的概率;
二者的结合;
一般化:未来收益的重要程度
无名氏定理(Folk Theorem)
在无限次重复博弈中,如果参与人对未来足够重视( 足够大),那么,任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到。
这里“合作程度”定义为整个博弈中合作出现的频率。
50年代就人所共知,但无人有发明权;
Tit-for-tat
纳什均衡,但不是精炼纳什均衡: