1 / 35
文档名称:

CH02混合策略(博弈论,张醒洲).ppt

格式:ppt   大小:708KB   页数:35页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

CH02混合策略(博弈论,张醒洲).ppt

上传人:541807096 2021/7/31 文件大小:708 KB

下载得到文件列表

CH02混合策略(博弈论,张醒洲).ppt

相关文档

文档介绍

文档介绍:*
大连
*
混合策略
找到不确定情况下的最优反应
定义 在一个n人博弈的标准式表述中,参与人的策略
空间为 ,收益函数为 ,我们用
表示此博弈。
*
,大连
*
纳什均衡
博弈的标准式和纳什均衡
*
,大连
*
举例: 猜硬币
模型
两个参与人 {1,2}
每个参与人的策略
空间为{H,T}
收益
零和
试着找到纳什均衡
两个男孩各自有一个硬币并且他们必须选择将硬币的正面朝上还是背面朝上。如果两个硬币朝上的面相同(即都是正面或都是背面),则参与人2将赢得参与人1的硬币;否则,参与人1将赢得参与人2的硬币。
猜硬币
如果参与人的策略一致——(正面,正面) 或 (反面,反
面)—则参与人1会偏向于改变策略;
但是如果两者策略不一致—(正面, 反面) 或 (反面, 正
面)—则参与人2偏向于改变策略。
没有一组策略满足 (NE)
4
*
,大连
*
石头-剪刀-布博弈
此博弈也不存在纳什均衡
无论参与人1选择哪个纯策略,参与人都可以打败他。
*
,大连
*
猜对方策略
猜硬币博弈一个非常突出的特点是每个参与人都试图猜中对方的策略。
任何这一类都没有纳什均衡

因为这一类博弈的解包含了一个参与人对其他参与人行为的不
确定。
现在我们介绍混合策略
*
,大连
*
纯策略,混合策略
考虑标准式博弈G={S1,····, Sn; u1 ,····, un}
此后我们定义Si 中的策略为参与人 i 的纯策略
在本节的完全信息同时行动博弈中,一个参与人的纯策
略就是他可以选择的不同行动;
例如,在猜硬币的博弈中,Si 包含两个纯策略:正面
和背面。
参与人i的一个混合策略是在其策略空间Si中的
(一些或全部)策略的概率分布。
*
,大连
*
概率和信念
随机事件
.
在进行观察或试验前,,并且能判断每一个事件出现的可能性大小.
概率
事件的概率是对一次随机试验中该事件出现的可能性的度量
如果对可能性的度量以某种客观规律或物质属性为基础, 我们就用“概率”一词
如果对可能性的度量以个人经验、主观判断为基础,就用“主观概率”、“信念”、“置信度”等术语
*
,大连
*
概率分布
样本空间:Ω={ω1 , ω2 , …, ωn,…}
试验中可能出现的所有基本结果ωi的集合
事件由基本结果组成,是样本空间的子集。如果在试验中事件A中的一个结果出现了,就说事件A发生。
概率分布就是将总概率P(Ω)=1分解到所有可能的样本点或事件上的一种方式.
*
,大连
*
概率的公理化定义
概率测度

样本空间Ω上的一个概率测度是Ω的子集的一个函数P( · ) ,它
满足三条公理:
公理(1) 0≤P(E) ≤1, 对任一事件E
公理(2) P(Ω)=1
公理(3) 对任何一列互不相容的事件E1,E2,….,即Ei∩Ej=Ф(空集),
i≠j, 有

我们称P(E)为事件E的概率。