文档介绍:博弈论讲义04 序贯决策博弈(完全信息动态博弈)
第四章序贯决策博弈
(完全信息动态博弈)
商场硝烟
A
B
B
A
不制止
制止
(-2,5)
(2,2)
(10,4)
(5,5)
不仿冒
(0,10)
仿冒
不制止
制止
仿冒
不仿冒
复习:博弈的表述形式
博弈的表述形式
(一)矩阵型(正规型,策略型)
同时决策博弈/静态博弈
(二)树型(展开型):博弈树
序贯决策博弈/动态博弈
大黑点:根,决策节点
小黑点:分支点,决策节点
菱形:末端节点
直线:枝,棱
括号+数字:支付
进入者
进入
不进
容忍
抵抗
垄断者
垄断者
(1, 5)
(-2, 2)
容忍
抵抗
(0, 10)
(0, 4)
第一节博弈的扩展式:序贯博弈
序贯博弈/完全信息动态博弈:
完全信息:各种博弈情形下的支付是参与人的共同知识
动态:决策有先后
博弈树的构成:
11>.节点nodes
( branches,棱)
(1)代表参与人的策略选择以及路径
(2)不交叉,不长回本身
(1)首次行动顺序原则:按照某参与人首次行动的顺序排序
(2)维数:参与人数目
初始决策节点(decision nodes) :根
末端节点(terminal nodes):结果
其他决策节点:与某参与人对应
进入者
进入
不进
容忍
抵抗
垄断者
垄断者
(1, 5)
(-2, 2)
容忍
抵抗
(0, 10)
(0, 4)
第一节博弈的扩展式:序贯博弈
博弈树必须满足下列规则:
每一个结至多有一个其他结直接位于它的前面;
每一个结是唯一初始结的后续结, 即博弈树必须有初始结;
每个博弈树“正好”只有一个初始结
由以上规则,对于博弈树中的每一个终点结,完全可以确定从初始结到终点结的路径,同时也展示了博弈的动态过程。
下面的情况是不允许的:
第一节博弈的扩展式:序贯博弈
博弈的扩展式表述包括三个要素:
参与人集合
每个参与人的策略集合
由策略组合决定的每个参与人的支付
扩展式表述所“扩展”的主要是参与人的策略空间
矩阵式表述简单地给出参与人有些什么策略可以选择,而扩展式表述要给出每个策略的动态描述:谁在什么时候行动,每次行动时有些什么具体行动方案可供选择,以及知道些什么
此时的策略:如果你这样,我将怎样
进入者
进入
不进
容忍
抵抗
垄断者
垄断者
(1, 5)
(-2, 2)
容忍
抵抗
(0, 10)
(0, 4)
第一节博弈的扩展式:序贯博弈
策略与行动
行动:某参与人在决策节点上的具体选择
策略:某参与人的完整行动计划
如果对方采取了某行动,自己如何做?
扩展式中的纯策略被定义为一个决策规则
例:进入障碍博弈
进入者有两个纯策略:进入,不进入
垄断者有四个纯策略:
(1)不管你怎样,我总“容忍”?? {容忍,容忍}
(2)不管你怎样,我总“抵抗”?? {抵抗,抵抗}
(3)你进入我“抵抗”,你不进入我“容忍”?? {抵抗,容忍}
(4)你进入我“容忍”,你不进入我“抵抗”?? {容忍,抵抗}
进入者
进入
不进
容忍
抵抗
垄断者
垄断者
(1, 5)
(-2, 2)
容忍
抵抗
(0, 10)
(0, 4)
第二节序贯博弈的纳什均衡求解
囚徒困境博弈的扩展式表述
智猪博弈的扩展式表述?
小偷甲
坦白
抵赖
坦白
抵赖
小偷乙
小偷乙
(-3, -3)
(0, -5)
坦白
抵赖
(-5, 0)
(-1, -1)
小偷乙
坦白
抵赖
坦白
抵赖
小偷甲
小偷乙
(-3, -3)
(0, -5)
坦白
抵赖
(-5, 0)
(-1, -1)
第二节从同时决策博弈到序贯决策博弈
囚徒困境博弈的扩展式表述
智猪博弈的扩展式表述?
情侣博弈的扩展式
第二节从同时决策博弈到序贯决策博弈
情侣博弈的扩展式
策略集
1. 男方策略集:{足球,芭蕾}
2. 女方策略集
(1)追随策略:他选什么我就选什么?? {足球, 芭蕾}
(2)对抗策略:他先什么我偏不选什么?? {芭蕾, 足球}
(3)芭蕾策略:无论他选什么,我都选自己喜欢的芭蕾?? {芭蕾, 芭蕾}
(4)足球策略:无论他选什么,我都选他喜欢的足球?? {足球, 足球}
男
足球
芭蕾
足球
芭蕾
女
女
(2, 1)
(0, 0)