文档介绍:博弈论
美藉匈牙利数学家冯·诺依曼(John Von Neuman)和美藉奥地利经济学家摩根斯顿(Morgenstern)相识于普林斯顿大学,他们于1944年出版了经典著作《博弈论与经济行为》,为现代博弈论的发展奠定了基础。
美国的数学家、经济学家纳什(John Nash),美籍匈牙利经济学家海萨尼(John C. Harsanyi)和德国经济学家泽尔滕()因对博弈论的卓越贡献而获得1994年度的诺贝尔经济学家。
海萨尼
纳什
值得一提的是纳什,他发表奠定其在博弈论中重要地位的学术论文时,年仅22岁,被人称为“一个天才”。1959年,纳什被精神病医生诊断为“妄想性精神分裂”,饱受精神病折磨40余年。
泽尔滕
第一节博弈的基本要素与分类
(一)囚徒困境
囚徒困境是博弈论中的一个著名案例,它简明地勾勒和
刻画了博弈论的基本特征和博弈的基本要素。这一案例可由
下面的得益矩阵来直观地表示。
囚徒B
交代不交代
交代-5,-5 0,-8
不交代-8,0 -1,-1
囚徒困境的得益矩阵
囚徒A
(二)博弈的基本要素
,或称博弈方:可以是一个、二个或多个;可
以是个人、厂商,也可以是国家。
:是指博弈中的任一参加者针对其他参加者的可
能的行为所采取的行为原则和应对办法。
:是指博弈参与者所获得的收益或效用。
:是指博弈的所有参与者从自我利益最大化出发
选择的策略所组成的策略集。
(一)合作博弈和非合作博弈
:如果各博弈方能达成某种有约束力的契约
或协议(包括默契)以使他们选择共同的或联合的策略。
:反之,就属于非合作博弈。
(二)单人博弈、双人博弈和多人博弈
(三)有限策略博弈和无限策略博弈
(四)零和博弈、常和博弈与变和博弈
:是指在博弈中,一方的得益就是另一方的损
失,所有博弈方的得益总和为零。
:是指所有博弈方的得益总和为非零的常数。
:也称非常和博弈,它意味着不同的策略组合
或结果下各博弈方的得益之和一般是不相同的。
(五)静态博弈和动态博弈
:是指所有博弈方同时或可看作同时选择策
略、采取行动的博弈。
:是指博弈方的选择、行动有先有后,而且后
选择、后行动的博弈方在自己进行选择、行动之前可以看到在
他之前选择、行动的博弈方的选择、行动的博弈。
(六)完全信息博弈和不完全信息博弈
:是指每一参与者都拥有所有其他参
与者的特征、策略集及得益函数等方面的准确信息的博弈。
:是指参与者只了解上述信息中的
一部分的博弈。
将博弈的信息特征和行为时间特征结合起来,可以进一
步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
信息特征
完全信息不完全信息
完全信息静态博弈不完全信息静态博弈
纳什均衡贝叶斯纳什均衡
完全信息动态博弈不完全信息动态博弈
子博弈精炼纳什均衡精炼贝叶斯纳什均衡
四种博弈及其相应的均衡
静态
动态
行动先后顺序
第二节完全信息静态博弈
完全信息静态博弈中各博弈方同时决策,且所有博弈
方对博弈中的各种情况下的策略及其得益都完全了解的。
:是指对某博弈方来说,不管其他博弈方采取什么策
略,他所采取的能给他带来最大得益的策略。
下图博弈中,厂商A和B的上策都是做广告。上策均衡也是
两家厂商都选择做广告的策略。
厂商B
做广告不做广告
做广告 10,5 15,0
不做广告 6,8 10,2
广告博弈的得益矩阵
厂商A
,博弈方
选择了它所能选择的最好的策略(或采取了它所能采取的最
好的行动)。
下图博弈中,厂商A和厂商B都选择做广告的博弈均衡解就是纳什均衡。
厂商B
做广告不做广告
做广告 10,5 15,0
不做广告 6,8 20,2
修改过的广告博弈矩阵
每一个上策均衡一定是纳什均衡,但并非每一个纳什均
衡都是上策均衡。上策均衡是纳什均衡的特例。
厂商A
智猪博弈(boxed pig game)
假设猪圈里有一大一小两头猪,猪圈的一头有一个猪食槽,另一头有一个按钮,控制着猪食的供应。揿一下按钮就会有10个单位的猪食进槽,供猪食用,但谁揿按钮谁就得付出2个单位的效用成本。
如图,如果大猪与小猪同时去揿按钮,大猪吃到7个单位的猪食(扣去2个单位的效用成本,剩下的效用单位为5,显然这里假设1个单位的猪食提供1个单位的效用),小猪吃到3个单位的猪食(扣去2个单位的效用成本,剩下的效用单位为1);如果小猪去揿按钮