文档介绍:对策论矩阵求解
现在讨论 为支付矩阵的对策 的解。为此先解方程组
和
上述不等式组无解,根据计算下面两个不等式组
对策论矩阵求解
现在讨论 为支付矩阵的对策 的解。为此先解方程组
和
上述不等式组无解,根据计算下面两个不等式组
二、线性规划方法
解:先将A的每个元素加3,得到每个元素都是整数的支付矩阵
转而讨论以A1为支付矩阵的矩阵对策 ,为此求解两个互为对偶的线性规划问题
三、迭代法
迭代法是求矩阵对策的一种近似方法。
基本思想:
假设两个局中人反复进行对策多次,在每一局中各局中人都从自己的策略集中选取一个使对方获得最不利结果的策略,即第t局对策纯策略的选择欲使对手在前t-1局中累计所得(或累计所失)最少(或最多)
具体做法:
在第1局中,从两个局中人中任选一个,如局中人Ⅰ,让他先采取任意一个策略,如αi 。然后,局中人Ⅱ随之采取策略β j ,使采取αi的局中人Ⅰ的所得最少。在第2局中,局中人Ⅰ还认为局中人Ⅱ采取策略β j ,故采取某策略αi使局中人Ⅱ的所失最多,局中人Ⅱ又采取策略,使采取局中人Ⅰ在这两局中累计赢得最少。在第3局中,局中人Ⅰ又采取某策略使局中人Ⅱ在前两局的累计所失最多,然后局中人Ⅱ又采取某策略,
局中人Ⅰ在这三局中累计赢得最少。以后各局均照此方式对策下去,直到迭代的结果达到一定的满意程度为止。
近似解:
若设在N局对策中局中人Ⅰ出α1,α2, …,αm的次数为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n的次数为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N),
则(xN, yN )就是所求近似解。
令:
则VN是对策值VG的近似值。
{xN}的每一个收敛子列收敛于局中人Ⅰ的最优策略, {yN}的每一个收敛子列收敛于局中人Ⅱ的最优策略。{VN}收敛于VG 。
j=1
n
∑ aijlj
max
1≤ i≤m
VN
 ̄
=(
) /N
i=1
m
∑ aijki
min
1≤ j≤n
VN
_
=(
) /N
VN=(
VN
_
VN
 ̄
+
) /2
迭代算法的终止准则:
1、给定迭代次k
2、给定允许误差 ,当迭代次数k满足
时,迭代结束。
,允许误差
感谢您的关注