文档介绍：博弈论及其应用 Game Theory with Applications
第三章:完全且完美信息动态博弈Chapter III: Dynamic Game plete & Perfect Information
2017/11/25
2
动态关系
网络诗歌
我站在未来的山坡上回头看
过去和现在如同不再有悬念的平静湖面
所有发生的一切都是如此清晰和必然

事前难以预测
事后却成必然
棋局、股价与政策
棋局:对弈的基本规则与原则
股价:事后判断什么时候买进什么时候卖出很容易
政策:其有效性取决于大众的反应
2017/11/25
3
完美信息
plete information
我方知道对方知道的一切,对方知道我方知道对方的一切
对方知道我方知道的一切,我方知道对方知道我方的一切
一切通常用效用或类型来描述
动态博弈dynamic game
后行动者看到先行动者的行为选择之后再选择自己的行为
如果在选择自己行为之前看不到对方的行为就是静态博弈
完美信息perfect information
后行动者记得此前的全部博弈进程,称为完美信息
全部博弈进程包括
局中人的博弈顺序
每个局中人在各个阶段的行为选择
2017/11/25
4
动态博弈中的行为与战略I
事例1:中美战略博弈
解放初,美提出了“人不犯我、我不犯人,人若犯我、我必犯人”的战略方针。
模型描述
局中人
美国和中国
行动空间
美国:{来犯,不犯}
中国:{犯人,不犯}
行动顺序
先行者:美国
后行者:中国
2017/11/25
5
动态博弈中的行为与战略II
模型描述
战略空间
美国——先行者
战略就是行动
中国——后行者
战略是针对先行者各种可能行动而制定的行动方案,包括
美国犯我,我犯人;美国不犯我,我犯人
美国犯我,我不犯人;美国不犯我,我不犯人
美国犯我,我犯人;美国不犯我,我不犯人
美国犯我,我不犯人;美为
(犯人,犯人); (不犯人,不犯人)
(犯人,不犯人); (不犯人,犯人)
2017/11/25
6
动态博弈中的行为与战略III
模型描述
收益刻画
美犯我,我犯人:美-2,中-3
美犯我,我不犯人:美1,中-4
美不犯我,我犯人:美2,中-5
美不犯我,我不犯人:美0,中0
收益矩阵
纳什均衡
美不犯我,我不犯美
(犯人,犯人)
(犯人,不犯人)
(不犯人,犯人)
(不犯人,不犯人)
犯我
-2,-3
-2,-3
1,-4
1,-4
不犯我
2,-5
0,0
2,-5
0,0
2017/11/25
7
动态博弈中的行为与战略IV
事例2:产品开发博弈
两企业就是否开发某种新产品展开竞争。设A先决定是否开发,B看到A的选择后再决定是否开发。如果只有一家企业开发,开发者将获利1,不开发者收益不变。如果两家企业都开发,各自将亏损3。如果都不开发,收益都不变。
模型描述
局中人
企业A和企业B
行动空间
{开发,不开发}
行动顺序
A先行动,B后行动
2017/11/25
8
动态博弈中的行为与战略V
模型描述
战略空间
企业A
与行动空间相同
企业B
是针对A行动的一系列行动方案,包括
A开发,B开发;A不开发,B开发
A开发,B开发;A不开发,B不开发
A开发,B不开发;A不开发,B开发
A开发,B不开发;A不开发,B不开发
简记为
(开发,开发); (开发,不开发)
(不开发,开发); (不开发,不开发)
2017/11/25
9
动态博弈中的行为与战略VI
模型描述
收益矩阵
纳什均衡
企业A开发B不开发
(开发,(不开发,开发))
(开发,(不开发,不开发))
企业A 不开发B开发
(不开发,(开发,开发))
(开发,开发)
(开发,不开发)
(不开发,开发)
(不开发,不开发)
开发
-3,-3
-3,-3
1,0
1,0
不开发
0,1
0,0
0,1
0,0
2017/11/25
10
动态博弈中的行为与战略VII
总结:动态博弈的矩阵描述存在的问题
战略空间复杂
后行动者的战略空间随局中人的数量和每一阶段局中人的行动选择数量而急剧增大
对多人多行动的动态博弈,难以用矩阵描述
纳什均衡有待精炼
可能多个均衡描述的是同一个结果
可能存在不合理的均衡