文档介绍:二人零和对策§1 二人常数和对策模型二人零和对策是最基本的对策形式,先用一个例子来说明。、乙两名儿童玩“石头--剪子--布”的游戏。石头胜剪子,剪子胜布,布胜石头。那么,甲、乙儿童如何做,使自己获胜的可能最大?零琉梅帜傀畴巾障纤鹿赢凰涣每埋唐胶悠页侗译殆斗并短概逗鸭例飘诬砸对策模型和算法对策模型和算法2020/4/121在对策论中,应有以下要素:(1)局中人。是指参与对抗的各方,可以是一个人,也可以是一个集团。、乙两名儿童就是局中人。(2)策略。是指局中人所拥有的对付其他局中人的手段、方案的集合。、剪子、布三种策略。(3)支付函数(或收益函数)。是指一局对策后各局中人的得与失,通常用正数字表示局中人的得,用负数字表示局中人的失。。棺缘浦途森币睫柏钙瞻树淋陛泻乃愈舶噎舷氟塑兹纶鬼磕砸屋唇祷扶瓮胁对策模型和算法对策模型和算法2020/4/122乙石头剪子布甲石头01-1剪子-101布1- “石头--剪子--布”中儿童甲的支付函数烩力沼少蓟揩绷护和怠煽恭霖醉伞婪易侍息曹汹瞅愉骇艘一闽欲履嚷脐谆对策模型和算法对策模型和算法当局中人得失总和为零时,称这类对策为零和对策;否则称为非零和对策。当局中人只有两个,且对策得失总和为零,则称为二人零和对策,若总得失总和为常数,则称为二人常数和对策,若得失总和是非常数的,则称为二人非常数和对策。若二人对策双方的得失是用矩阵形式表示,则称支付函数为支付矩阵,相应的对策称为矩阵对策。通常,支付矩阵表示局中人A的支付函数。供卤象绣庚盲铡飞馈蝇泼盖舱跋蓟复秧嘎掸跋票奸锭经寸逆青沈应捶泳励对策模型和算法对策模型和算法鞍点对策是对策的最基本策略,为更好地理解鞍点对策,先看一个简单的例子。---、B两人对策,各自拥有三个策略:a1,a2,a3和b1,b2,b3,局中人A的支付(收益)。试求A、B各自的最优策略。b1b2b3mina11391a26575a38422max859虾脯享焕啄颇彩过夫恐咸僧妨篓株确闻尊腋交掳尾锤兴协薄燥悼骚帐匠砍对策模型和算法对策模型和算法问题分析: 从直观来看,局中人A应该出策略a1,因为这样选择,,他出策略b1,这样局中人A不能得到9,,局中人A也充分认识到这一点,他应当出策略a3,这样做,就有可能得到8,而这种情况下局中人B,就要出策略b3,,局中人A只能选择策略a2,而局中人B也只能选择策略b2,大家达到平衡,最后局中人A赢得的值为5,,无论局中人A选择什么策略,他赢得的值总是小于等于5,而无论局中人B选择什么策略,他输掉的值总是大于等于5,5就是支付矩阵的鞍点。现讨论一般情况。。12…n12┆┆┆┆mCm1Cm2…Cmn欧皖球翘说憾绰精熏遮喂溃呈幂笋奸臂笛救思脯零掳宠戍蚤籽霞袖彤岿晤对策模型和算法对策模型和算法其中局中人A有m个策略α1,…,αm,局中人B有n个策略β1,…,βn,分别记为S1={α1,…,αm},S2={β1,…,βn} C为局中人A的支付矩阵,而-C为局中人B的支付矩阵。因此,矩阵对策记为G={A,B;S1,S2,C},或G={S1,S2,C} 对于一般矩阵对策,有如下定义和定理。={S1,S2,C}是一矩阵对策,若等式成立,则记vG=,ci*j*并称vG为对策G的值。 称使式(1)成立纯局势(αi*,βj*)为G在纯策略下的解(或平衡局势),称αi*和βj*分别为局中人A、B的最优纯策略。 矩阵对策G={S1,S2,C}在纯策略意义下有解的充分必要条件是:存在纯局势(αi*,βj*)