1 / 35
文档名称:

ch混合策略(博弈论,张醒洲).pptx

格式:pptx   大小:760KB   页数:35页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

ch混合策略(博弈论,张醒洲).pptx

上传人:marry201208 2022/3/16 文件大小:760 KB

下载得到文件列表

ch混合策略(博弈论,张醒洲).pptx

文档介绍

文档介绍:2020-02-05
张醒洲,大连
1
混合策略
找到不确定情况下的最优反应
定义 在一个n人博弈的标准式表述中,参与人的策略
空间为 ,收益函数为 ,我们用 1 - q), 其中q 为正面朝上的概率,1 - q 是背面朝上的概率, 并且 0 < q < 1.
参与人 2
参与人 1
正面
q
背面
1-q
正面
-1, 1
1, -1
背面
1, -1
-1, 1
混合策略 (0,1) 是背面朝
上的纯策略; 类似地, 混合
策略 (1,0) 是正面朝上的
纯策略。
2020-02-05
张醒洲,大连
12
混合策略: 举例
参与人2 的一个混合策略为概率分布( q, r,1-q-r), 其中 q表示出左的概
率, r 表示出中的概率, 1 - q – r 表示出右的概率。和前面一样,
0 < q < 1, 并且还应满足 0 < r < 1 和 0 < q + r < 1。
混合策略 (1/3,1/3,1/3) 表示参与人出左、中、右的概率相同,而
(1/2,1/2,0) 表示出左、中的概率相同,但不可能出右。
参与人 2




1, 0
1, 2
0, 1
参与人 1

0, 3
0, 1
2, 0
图 at Pager 6
参与人的一个纯策略只
是其混合策略的一个特
例,例如参与人2出左的
纯策略可表示为混合策
略 (1,)。
2020-02-05
张醒洲,大连
13
混合策略:定义
更为一般地,假定参与人 i有K个纯策略:Si ={si1, …,siK}.参与人 i的一个混合策略是一个概率分布 ( pi1, …,piK ) ,其中 piK表示对所有k=1, …,K,参与人i选择策略 sik的概率,由于 pik是一个概率,对所有k=1, …,K,有 0≤pik≤ 1且 pi1+···+piK =1。我们用 pi表示基于Si 的任意一个混合策略,其中包含了选择每一个纯策略的概率,正如我们用 si表示 Si 内任意一个纯策略。
定义 对标准式博弈 ,假设S i = { si1, …,siK } 。
那么,参与人i的一个混合策略为概率分布 pi= ( pi1, …,piK ),其中对
所有 k=1, …,K, 0≤pik≤ 1,且 pi1+···+piK =1。
2020-02-05
张醒洲,大连
14
参与人 j的混合策略解释
当参与人 i不确定参与人 j会如何行动时,他可以把参与人 j的混合策略作为参与人 j行动的一个解释。
参与人 2
参与人 1
正面
q
背面
1-q
正面
-1, 1
1, -1
背面
1, -1
-1, 1
例如: 猜硬币
假设参与人1相信参与人会以q 的概率出正面,以1 - q 的概率出背面;也就是说,1 相信2的混合策略是 ( q, 1-q )。
2020-02-05
张醒洲,大连
15
猜猜硬币另一面的颜色
这里有三枚硬币,每一面被贴上红色或白色纸片(如下图).为了方便从左向右编号1、2、3.
1
2
3
现在从中任取一枚放在桌面,结果你看到白色。请猜一下,这枚硬币的背面是什么颜色?
统计频数
红色 人
白色 人
共 人
计算频率
红色 %
白色 %
2020-02-05
张醒洲,大连
16
猜猜哪个硬币被标记了
1/2
1/3
1/3
1/2
1/2
1/2
1/2
1/2
1/3
N
C2
C1
C3
这里有三枚硬币,每一面被贴上红色或白色纸片(如下图).为了方便从左向右编号1、2、3号硬币
1
2
3
现在从中任取一枚放在桌面,结果你看到白色。请猜一下,这是几号硬币?
2020-02-05
张醒洲,大连
17
猜猜哪个硬币被标记了
提示:
根据条件“看到一面白色”, 只考虑前两枚硬币(拿走两面全是红色的第三枚硬币).
区分第一枚硬币的两个面,尽管它们同色同质。你可以设想给第一枚的两面分别标记11与12。