文档介绍:引言
对策也叫博弈,是自古以来政治家和军事家都很注意研究的问题。作为一门学科是在20世纪40年代形成并发展起来的。
指导1944年冯诺依曼与摩根斯特恩的《博弈论与经济行为》一书出版,标志着现代系统博弈论的初步形成。
在日常生活中,经常可以看到一些具有相互斗争或竞争性质的行为,如下棋、打牌、体育比赛等。还有企业间的竞争、军队或国家间的战争、政治斗争等,都具有对抗的性质。这种具有竞争或对抗性质的行为称为对策行为。在这类行为中,各方具有不同的目标和利益。为实现自己的目标和利益,各方必须考虑对手可能采取的行动方案,并力图选择对自己最为有利或最为合理的行动方案。
例如,我国战国时期的“齐王赛马”就是典型的对策行为。
对策论的基本概念
三个基本要素;
: 在一个对策行为中,有权决定自己行动方案的对策参加者。如“齐王赛马”的例子中,局中人是齐王和田忌,即参与对抗的各方;
:局中人选择对付其它局中人的行动方案称为策略。
某局中人的所有可能策略全体称为策略集;
3. 赢得函数各局中人分别选定自己的策略构成的策略组称为一个局势,当局势出现后,对策的结果也就确定了。对于局势s,局中人i可以得到一个赢得Hi(s),它是局势s的函数,称为局中人i的赢得函数。
“齐王赛马”齐王在各局势中的益损值表(单位:千金)
其中:
齐王的策略集: S1={1,2,3,4,5,6}
田忌的策略集:S2={1,2,3,4,5,6}
下列矩阵称齐王的赢得矩阵:
3 1 1 1 -1 1
1 3 1 1 1 -1
A= 1 -1 3 1 1 1
-1 1 1 3 1 1
1 1 1 -1 3 1
1 1 -1 1 1 3
对策的分类:
1)按局中人的多少分为二人对策和多人对策。
2)按策略集中策略的有限或无限,分为有限对策和无限对策。
3)按各局中人赢得函数的代数和是否为零,分为零和对策和非零和对策。
在众多对策模型中,占有重要地位的是二人有限零和对策,又称为矩阵对策。矩阵对策可以说是一类最简单的对策模型,其研究思想和方法十分具有代表性,体现了对策论的一般思想和方法,且其基本的结果也是研究其他对策模型的基础。
二人有限零和对策:(又称矩阵策略)
局中人为2;
每局中人的策略集中策略数目有限;
每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。
矩阵对策纯策略意义下的解
矩阵对策就是二人有限零和对策,是指有两个参加对策的局中人,每个局中人都只有有限个策略可供选择。设两个局中人为Ⅰ、Ⅱ,它们各自的策略集为
S1={α1,α2,…,αm} S2={β1,β2,…,βn}
当局中人Ⅰ选定纯策略αi,局中人Ⅱ选定纯策略βj后,就形成了一个纯局势(αi,βj),这样的纯局势共有m·n个。
对任意纯局势(αi,βj),记局中人I的赢得值为aij,并称
a11 a12 ˙˙˙a1n
a21 a22 ˙˙˙a2n
A= ˙˙˙
˙˙˙
am1 am2 ˙˙˙amn
为局中人I的赢得矩阵(或为局中人II的支付矩阵),由于假定策略为零和的,故局中人II的赢得矩阵就是–A。
对任一纯局势(αi,βj),记局中人Ⅰ的赢得值为aij,则得矩阵 A=(aij),称为矩阵人Ⅰ的赢得矩阵。由于是零和对策,则矩阵人Ⅱ的赢得矩阵为-A。矩阵对策的名称正是由此而来。通常把矩阵对策记为
G={Ⅰ,Ⅱ;S1,S2;A} 或 G={S1,S2;A}
G = {S1, S2, A}
甲的策略集甲的赢得矩阵
乙的策略集
“齐王赛马”即是一个矩阵策略.