文档介绍:2009年中小科技型企业发展专项引导资金经贸交流合作项目申报要求
2009年中小科技型企业发展专项引导资金经贸交流合作项目申报要求
§ 混合战略及纳什定理
Mixed strategy
& Nash theorem
猜硬币游戏 matching pennies
猜硬币游戏 matching pennies
-1, +1
+1, -1
Tails
+1, -1
-1, +1
Heads
Tails
Heads
B
A
纳什均衡为:
石头剪子布
找水?
休息?
找水?
休息?
石头剪子布
0,0
-1,+1
+1,-1
+1,-1
0,0
-1,+1
-1, +1
+1,-1
0,0
石头
剪子
布
猪八戒
石头
剪子
布
孙悟空
纳什均衡为:
单纯策略与混合策略
单纯策略 pure strategy:
基本策略
混合策略的特例
混合策略 mixed strategy:
全部单纯策略的概率分布
局中人 i 以概率 pi (sij ) 选择单纯战略 sij
猜硬币游戏 matching pennies
-1, +1
+1, -1
Tails
+1, -1
-1, +1
Heads
Tails
Heads
B
A
此博弈不存在单纯战略的纳什均衡。
是否存在混合战略的纳什均衡?
猜硬币游戏 matching pennies
-1, +1
+1, -1
Tails
+1, -1
-1, +1
Heads
Tails
Heads
B
A
A B 两人在混合战略中的支付:
对于A:A认为B选正面的概率为q,选反面的概率为1-q
A选正面的支付为:
q×(-1)+(1-q)×1=1-2q
A选反面的支付为:
q×1+(1-q)×(-1)=2q-1
A (正面,反面)
( p , 1-p )
B (正面,反面)
( q , 1-q )
猜硬币游戏 matching pennies
-1, +1
+1, -1
Tails
+1, -1
-1, +1
Heads
Tails
Heads
B
A
对于B:B认为A选正面的概率为p,选反面的概率为1-p
B选正面的支付为:
p×1+(1-p)× (-1) =2p-1
B选反面的支付为:
p×(-1)+(1-p)×1=1-2p
A (正面,反面)
( p , 1-p )
B (正面,反面)
( q , 1-q )
猜硬币游戏 matching pennies
A的最优选择是什么?
max vA ( p , q)
= max {p[q×(-1)+(1-q)×1]+(1-p)[ q×1+(1-q)×(-1)] }
= max {p(1-2q) +(1-p)(2q-1)}
B的最优选择是什么?
max vB( p , q)
= max {q[p×1+(1-p)×(-1)]+(1-q)[ p×(-1)+(1-p)×1] }
= max {q(2p-1) +(1-q) (1-2p)}
期望收益函数
V-N-M 收益函数
冯·诺伊