1 / 69
文档名称:

对策模型和算法.ppt

格式:ppt   大小:2,212KB   页数:69页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

对策模型和算法.ppt

上传人:文库新人 2021/9/16 文件大小:2.16 MB

下载得到文件列表

对策模型和算法.ppt

文档介绍

文档介绍:对策模型和算法
在对策论中,应有以下要素:
(1) 局中人。是指参与对抗的各方,可以是一个人,也可以是一个集团。、乙两名儿童就是局中人。
(2) 策略。是指局中人所拥有的对付其他局中人的手段、方案的集合。、剪子、布三种策略。
(3) 支付函数(或收益函数)。是指一局对策后各局中人的得与失,通常用正数字表示局中人的得,用负数字表示局中人的失。。
2021/9/16
2

石头
剪子


石头
0
1
-1
剪子
-1
0
1

1
-1
0
 “石头--剪子--布”中儿童甲的支付函数
当局中人得失总和为零时,称这类对策为零和对策;否则称为非零和对策。
当局中人只有两个,且对策得失总和为零,则称为二人零和对策,若总得失总和为常数,则称为二人常数和对策,若得失总和是非常数的,则称为二人非常数和对策。
若二人对策双方的得失是用矩阵形式表示,则称支付函数为支付矩阵,相应的对策称为矩阵对策。通常,支付矩阵表示局中人A的支付函数。
鞍点对策是对策的最基本策略,为更好地理解鞍点对策,先看一个简单的例子。
1. 对策的基本策略---鞍点对策
、B两人对策,各自拥有三个策略:
a1, a2, a3和b1, b2, b3, 局中人A的支付(收益)
。试求A、B各自的最优策略。
b1
b2
b3
min
a1
1
3
9
1
a2
6
5
7
5
a3
8
4
2
2
max
8
5
9
问题分析:
从直观来看,局中人A应该出策略a1, 因为这样选择,他有可能得到9. 但局中人B看到了这一点,他出策略b1,这样局中人A不能得到9,而只能得到1. 因此,局中人A也充分认识到这一点,他应当出策略a3, 这样做,就有可能得到8,而这种情况下局中人B,就要出策略b3,局中人A也只能得到2.
这样做下来,局中人A只能选择策略a2, 而局中人B也只能选择策略b2,大家达到平衡,最后局中人A赢得的值为5,局中人B输掉的值为5.
从上面的分析可以看出,无论局中人A选择什么策略,他赢得的值总是小于等于5,而无论局中人B选择什么策略,他输掉的值总是大于等于5,5就是支付矩阵的鞍点。
现讨论一般情况。。
1
2

n
1
C11
C12

Cn1
2
C21
C22

Cn2




m
Cm1
Cm2

Cmn
其中局中人A有m个策略α1 , …,α m, 局中人B有n个策略β1, …, β n, 分别记为S1={α1 , …,α m}, S2= {β1, …, β n}
C为局中人A的支付矩阵,而-C为局中人B的支付矩阵。因此,矩阵对策记为G={A,B; S1, S2, C}, 或G= {S1, S2, C}
对于一般矩阵对策,有如下定义和定理。
= {S1, S2, C} 是一矩阵对策,若等式
成立,则记vG=, ci* j*并称vG 为对策G的值。
称使式(1)成立纯局势 (α i*, β j*)为G在纯策略下的解(或平衡局势),称α i*和β j*分别为局中人A、B的最优纯策略。

矩阵对策G={S1, S2, C}在纯策略意义下有解的充分必要条件是:存在纯局势(α i*, β j*)使得

2021/9/16
10