文档介绍:第十一章对策论
矩阵对策及其解法
其他类型对策问题
对策论在物流企业竞争策略分析中的应用
知识目标
了解对策论模型的三要素,掌握矩阵对策的模型、基本定理及解法;
了解其他类型对策,能够用所学对策论知识解决一些简单的实际问题.
技能目标
根据实际问题建立支付矩阵(建模);
根据最小最大原则、最大最小原则、优超原则等,利用图解法和线性规划法求出矩阵对策的最优策略和对策值.
第一节矩阵对策及其解法
本节的主要内容
对策现象的三要素及其分类
矩阵对策的数学模型
最优纯策略
混合策略和混合扩充
矩阵对策基本定理
矩阵对策的求解
对策现象的三要素及其分类
对策现象三个基本要素:局中人(players) 、策略集(strategies)和支付函数(赢得函数)(payoff function)。
对策现象的分类:根据局中人的数量分为“两人对策”和“多人对策”;根据局中人之间是否允许合作分为“合作对策”和“非合作对策”;根据局中人的策略集中的策略个数可分为“有限对策”和“无限对策”;根据局中人的支付函数的代数和是否为零可分为“零和对策”和“非零和对策”等。
矩阵对策的数学模型
矩阵对策就是有限两人零和对策。即参加对策的局中人只有两个,双方的利益是完全对抗的;每个局中人都有有限个可供选择的策略;且在任一局势(在对策论中,从每个局中人的策略集中各取一个策略组成的策略组)中,一个局中人的所得即为另一个局中人的所失,两个局中人的得失之和总等于零。
对于一个矩阵对策,当其3个基本要素确定后,这个对策的数学模型也就给定了。如果给定了局中人Ⅰ、Ⅱ的纯策略集合分别为S1、S2,局中人的支付矩阵为A,则把这个矩阵对策的数学模型记为
G ={Ⅰ,Ⅱ;S1;S2;A }或G = {S1,S2;A }
【例11-2】(“石头、剪刀、布”游戏)每个人都可能玩过这种游戏。石头击败剪刀,剪刀战胜布,而布又胜过石头。这里也是两个局中人:局中人Ⅰ、Ⅱ,双方各有3个策略,策略1代表出石头,策略2代表出剪刀,策略3代表出布。假定胜者得1分,负者得-1分。策略一样,就算“平局”,双方都不得分。取S1={石头、剪刀、布},S2={石头、剪刀、布},则局中人Ⅰ的支付矩阵A为
最优纯策略
对策的值——一个矩阵对策G,如果其支付矩阵A的元素满足:
矩阵对策G的鞍点——如果纯局势使
则称为对策G的鞍点,也称它是对策G在纯策略中的解,此时与分别为局中人Ⅰ和局中人Ⅱ的最优纯策略。
则称这个值V为矩阵对策G的值。
的值V
【例11-3】对于一个矩阵对策G ={Ⅰ,Ⅱ;S1,S2;A},其中
求双方的最优策略。
定理1:
为对策G的鞍点的充要条件是对于任意的
i,j,有,即鞍点具有这样的
性质: 是第j*列的最大元素,是第i*行的最小元
素。也就是说,对于纯局势,有下式成立:
也都是G的鞍点(称为鞍点的可
若
和
都是矩阵对策G的鞍点,
和
则
交换性),且在鞍点处的值都相等(称为鞍点的无差别性)。
定理2: