文档名称：

博弈论文.docx

格式：docx 大小：38KB 页数：5页

下载后只包含 1 个 DOCX 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

博弈论文.docx

上传人:wxc6688 2022/7/22 文件大小：38 KB

下载得到文件列表

博弈论文.docx

相关文档

文档介绍

文档介绍：博弈论方法的应用
一、博弈论概述
博弈论(game theory),也称对策论，它是运筹学的一个重要分支，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题，简单说来就是一些个人或其他组织，面对一定的环境条件，在一定犯罪，就能确认罪名成立．为了得到所需的口供，警察将这两名罪犯分别关押，防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；如果两人都坦白认罪，则他们将被各判8年监禁．问：两个罪犯会如何选择（即是坦白还是抵赖）？
下面可将整个博弈过程的结果用一矩阵形式表示出来．这种矩阵称为博弈的“得益矩阵（支付矩阵）（Payoff Matrix）”．
A与B的得益矩阵
囚徒B
囚徒A
坦白
不坦白
坦白
（－8，－8）
（0，－10）
不坦白
（－10，0）
（－1，－1）
可见:(1)对于囚徒A来说,囚徒B有“坦白”和“不坦白”两种可能的选择．如果B选择“坦白”,则对A来说, “不坦白”得益为-10, “坦白”得益为-8．如果B选择“不坦白”,则A“不坦白”得益为-1, “坦白”得益为0．若A只考虑自身的利益,则“坦白”为他的最优选择.
(2)同样的, 对于囚徒B来说,囚徒A有“坦白”和“不坦白”两种可能的选择．如果A选择“坦白”,则对B来说, “不坦白”得益为-10, “坦白”得益为-8．如果A选择“不坦白”,则B“不坦白”得益为-1, “坦白”得益为0．若B只考虑自身的利益,则“坦白”为他的唯一选择．
由于法庭对罪犯分别审讯，因而这个问题可以归结为非合作博模型．其中,局中人集合,1代表囚徒A,2代表囚徒B．两个人具有相同的策略集合:,其中C代表坦白,D代表抗拒的策略．对于策略组合两个局中人的支付函数如下:
由支付函数可以看出，囚徒A的最佳策略是坦白，囚徒B的最佳策略也是坦白，故纳什均衡为（坦白，坦白）．
在囚徒困境中，每个参与人都能猜出对方的策略，则称这种纳什均衡为纯战略纳什均衡．
囚徒困境反映了一个很深的问题，这就是个人理性与集体理性的矛盾．即使两个囚徒在被警察抓住之前建立一个攻守同盟（死不坦白），这个攻守同盟也没有用，因为它不构成纳什均衡，没有个人有积极性遵守协定．
通过对囚徒困境问题的分析，从中可得到一个重要的结论：一种制度安排，要发生效力，必须是一种纳什均衡，否则，这种制度安排便不能成立．
囚徒困境问题在经济学上也有着广泛的应用，例如：两个寡头企业选择产量的博弈．如果两企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多的利润．但卡特尔协定并不是一个纳什均衡，因为给定对方遵守协议的情况下，每个企业都想增加生产，结果是，每个都只能得到纳什均衡产量的利润，它严格小于卡特尔产量下的利润．这个例子也说明，在有些情况下，个人理性与集体理性的冲突对整个社会来说也许是一件好事，尽管它对该集体的成员而言是一件坏事，前述囚徒的行为也如此．当然，这里的前提条件是集体成员的数量严格小于全体社会成员的数量．
2、混合战略纳什均衡
再看这个问题:懒惰的儿子失业在家,父母有两个战略