文档介绍:第十章博弈论
第一节博弈论基础
一、博弈论(Game Theory)
博弈论研究决策主体的行为相互发生直接作用时的决策,以及这种决策的均衡问题。也就是说,一个主体(一个人或一个企业)的选择受到其他主体选择的影响,并且其选择反过来会影响到其他主体的选择,这类的的决策问题和均衡问题就是博弈论研究的对象。在这个意义上说,博弈论也称为“对策论”。
博弈论中的个体决策与传统经济学中的行为个体决策不同。
二、博弈论的基本概念
1、参与者/局中人(players):在博弈中选择行动以最大化自己效用的决策主体。
2、行动(acttions, moves):参与者的决策变量。
3、战略(strategies):参与者选择行动的规则。
4、信息(information):是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。
5、支付/收益(payoff):是参与人从博弈中获得的效用水平,是所有参与人战略或行动的函数,也是是每个参与人真正关心的东西。
6、结果(es):是指博弈分析者感兴趣的要素的集合。
7、均衡(equilibrium):是所行参与人的最优战略或行动的组合。
上述概念中,参与人、行动、结果统称为博弈规则,博弈分析的目的是使用博弈规则决定均衡。
三、博弈的分类
1、合作博弈(cooperative game)和非合作博弈(non- cooperative game ):
人们的行为相互作用时,当事人能不能达成一个具有约束力的协议,如果有,就是合作博弈;反之,则是非合作博弈。
现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈。
2、静态博弈(static game)与动态博弈(dynamic game):
按参与人行动的先后顺序划分,静态博弈:参与者同时决策,或非同时决策但后决策者不知道先决策者的行动。动态博弈:参与者的行动有先后,后决策者能观察到县决策者的行动,并据此选择行动。
3、完全信息博弈(games plete information)和不完全信息博弈( games of plete information ):
完全信息指的是每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识;否则,就是不完全信息。
第二节完全信息静态博弈
一、博弈的标准式(nomal form representation)
例:囚徒困境。囚徒面临的问题可用下图所示的双变量矩阵表来描述。
-1,-1
-9,0
0,-9
-6,-6
囚犯B
囚犯A
沉默
招认
沉默
招认
在此博弈中,每一囚徒有两种战略可供选择:招认、沉默)。
在一组特定的战略组合被选定后,两人的收益由矩阵中相应单元的数据来表示。
博弈的标准表述包括:(1)博弈的参与者,(2)每一参与者可供选择的战略集,(3)针对所有参与者可能选择的战略组合,每一个参与者获得的收益。
可以用支付矩阵表述一个博弈。
假定有n个参与者参加博弈,序号分别为1,2,…,n,第i个参与者可以选择的战略集合(i的战略空间)为Si ,每个具体的战略si为Si 的元素。令
( s1,s2,…,sn)为每个参与人选定一个战略的组成的战略组合, ui表示在该战略组合下参与人i的收益收益函数: ui( s1,s2,…,sn ),表述的标准形式为:
二、占优战略均衡(Dominant-stragety equilibrium)
一般来说,由于每个参与者的效用(支付)是博弈中所有参与人的战略的函数,因此每个参与者的最优战略选择依赖于所有其他参与人的战略选择。但在—些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominant stragety)。
三、重复剔除严格劣战略均衡(interated dominance equilibrium)
在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在绝大多数博弈中,不存在占优战略均衡。
在囚徒困境中,“招认”是每个囚犯的占优战略。博弈的结果是两人都选择“招认”,尽管福利不是最大。
-1,-1
-9,0
0,-9
-6,-6
囚犯B
囚犯A
沉默
招认
沉默
招认
占优战略均衡:
小猪
大猪
按
等待
按
等待
3,1
2,4
7,-1
0,0
考虑下面的“智猪博弈”。两猪共槽吃食,按下在房间另一端的按钮,能出食8单位,按下按钮者将付出2单位的代价。若大猪先到食槽,能吃到7单位的食,小猪只能吃到1单位的食;若小猪先到食槽,能吃到4单位的食,大猪能吃到4单位的食。
如果把“理性的参与者不会