文档介绍:一、博弈论简介
1. 引子
a) 非合作博弈定义:独立和理性的个体;利益相互
依赖、相互冲突
b) 例子:三人对决
局中人 A B C
枪法 30% 80% 100%
顺序 1st 2nd 3rd
问题:(1)A 如何打第一枪?(2)三人的存活机会?
2. 博弈模型要素
a) 局中人(player):独立理性 i=1,…,n.
b) 步法(move):ait
c) 战略(strategy)si={ait} 及战略空间 Si={si}
战略组合:s=(s1,…,sn)
d) 支付(payoff)πi ()s
e) 信息结构
mon Knowledge)
3. 博弈分类
j 确知πi ()s j 不了解πi ()s
一次行动,同完备信息静态不完备信息静态
时决策
(战略=步法) NE BNE
多次或序贯行完备信息动态不完备信息动态
动
(战略≠步法) SPNE PBE
二、完备信息静态博弈
1. NE 定义:s*=(s1*,…,sn*),任何人都没有单方改变
战略的动机。or:
∀∈sSiii,ππ(ss *) ≥ iii ( s ,−*) i = 1,…, n .
例 1.
B
左右
上, ,
A 2 2 2 1
下 1,1 3,0 NE:(上,左)
例 2.
B
左中右
上 7,7 6,6 7,6
NE:(上,左)
A 中 5,7 5,8 9,5
下 6,6 5,8 8,8
2. 关于 NE 的“预测”能力
例 :
B
左右
左, ,
A 1 1 -1 -1
右-1,-1 1,1 NE:(左,左)(右,右)
a) 不唯一性和偶然性
b) 短期:缺乏达成均衡的内在机制,可靠性低
c) 长期:经济达尔文主义,基本可靠
d) 实证研究 vs 规范研究
3. 两类特殊的 NE:内在实现机制
a) 占优战略 NE
例 4. 囚犯困境
B
利己利他
利己 1,1 4,0
A Pareto
利他 0,4 3,3
占优战略si*:∀s−i ,si ,ππ(*,ssiiss−−)≥(, ii )
占优战略均衡:s*
b) 重复剔除劣战略均衡
si 称为局中人 i 的一个(严格)劣战略:若存在sˆi ,使得
ππii(,ssss−− i )< ii (,ˆ i )——理性人决不会选之
例 5.
B
左中右
上 7,7 6,6 7,6
A 中 5,7 5,8 8,5
下 6,6 5,8 4,8
例 6. 智猪博弈
大小
小先 5 5
同时 7 3
大先 9 1
按键成本:2
支付矩阵:
小
按等
按 5,1 3,5
大等 9,-1 0,0
小猪有劣战略!
4. NE 的存在性
a) Nash 定理:有限博弈至少存在一个 NE
b) 反例?
例
B
正反
正 1,-1 -1,1
A 反-1,1 1,-1
均衡不存在??
5. 混合战略 NE
a) “战略”概念扩充:混合战略
正 50%+反 50% →正 p+反 1-p
正(反)——单纯战略
b) 假设:A——正 p+反 1-p,B——正 q+反 1-q
A 的期望支付:
pq[1(1)(1)]⋅+ − q ⋅−+
+−(1pq )[ ⋅−+−⋅( 1) (1 q ) 1]
FOC:420qq−= ⇒*1/2 =
考虑 B 的期望支付最大化问题,可得p*1/2=
NE:(正 50%+反 50%,B——正 50%+反 50%)
c) 混合战略均衡特点:对方现有战略前提下,局中
人使用任何战略(包括单纯战略)均不改变结果!
例 Battle
女
足球 q 音乐会 1-q
足球 p 4,2 1,1
男
音乐会 1-p 0,0 2,4
假设:男——足球 p+音乐会 1-p,B——足球 q+音 1-q
男的期望支付:
pq[4(1)1]⋅+ − q ⋅+
+−(1pq )[ ⋅+−⋅ 0 (1 q ) 2]
FOC:q*1/5=
考虑 B 的期望支付最大化问题,可得p*= 4/5
三、完备信息动态博弈
左(1,0)
a) 节点
B1
上右(2,1)
b) 战略
o
B:[正,