1 / 6
文档名称:

生活中的博弈论论文.docx

格式:docx   大小:10KB   页数:6页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

生活中的博弈论论文.docx

上传人:shugezhang1 2022/6/23 文件大小:10 KB

下载得到文件列表

生活中的博弈论论文.docx

相关文档

文档介绍

文档介绍:生活中的博弈论
这学期我在人文课的选择上,我选了“生活中的博弈论”这门课。 本来以为会很枯燥乏味,现在课要结束了,回想起来觉得还是挺有趣 的。其中含有很浓的智慧气息,趣味横生。下面就是我关于这门课的 小论文。
我们首先就会问,什么是博弈相应的策略以期获得足够的利益的过 程,这和传统的游戏是相通的,如最常见的斗地主,就是在一定的规 则下(如连牌至少5张一连等等),选择如何出牌(出牌的组合以及 出牌的顺序等等)而获胜(当然也可能输)的过程,这本身就是一个 三方博弈的过程。
为了能够了解博弈的含义,那么下面我们来看一下经典的博弈模 型。
需要提到的当然是任何与博弈有关的书籍中都会讲到的“囚徒困 境”。
囚徒困境的博弈的基本模型是这样的:警察抓了两个合伙犯罪的 罪犯,但却缺乏足够的证据指证他们所犯的罪行。如果其中至少有一 个供认犯罪就能确认罪名成立。为了得到所需的口供,警察将这两名 罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择 机会:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各 判一年徒刑;如果两人中有一人坦白认罪,则坦白者从轻处理,立即 释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们 将被各判5年监禁。
如果分别用-1,-5和-8表示判刑1年、5年、8年的得益,用0 表示被立即释放的得益,则我们可以用一个特殊的矩阵将这个博弈表 示出来,这种矩阵是表示博弈问题的一种常用方法,我们称这种矩阵 为一个博弈的:得益矩阵:
囚徒1、囚徒2代表两个博弈方,他们各自都有“坦白”和“不 坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一个 人在选择策略时都不可能知道另外一个选择什么,因此可能两人做出 选择时间不同,但是在选择时不知道对方的决定,因此我们在理论上 可以看做他们同时做出选择,那么下面我们就来分析一下,他们会如 何选择呢,如果是其中一个是你,你又会如何选择呢?
在分析之前我必须要说明一下,我们这里的博弈方是理性的,即 他总是考虑自身是否能得到最大的利益,而不是集体得到最大的利

例如对于囚徒1来说,囚徒2有坦白和不坦白两种可能的选择, 假设囚徒2选择的是“不坦白”,则对囚徒1来说,“不坦白”的得 益为
-1,坦白的得益为0,那么他肯定会选择坦白,假设囚徒2选择 的是“坦白”,那么囚徒1坦白的得益为-5,不坦白的得益为~8,他 肯定也会选择坦白。因此在本博弈中,无论囚徒2采用何种策略,只 考虑自身利益的囚徒1的选择是唯一的,那就是“坦白”,因为在另 一方的两种可能选择的情况下,“坦白”给他自己带来的得益都是最 大的。同样的,因为囚徒2与囚徒1的情况完全相同,因此囚徒2与 囚徒1的决策思路和选择也会和囚徒1完全一样,囚徒2在这个博弈 中唯一合理的选择也是“坦白”。所以该博弈的最终结果必然是两博 弈方同时选择“坦白”策略,同时被判5年。也许你会感到和奇怪, 他们怎么都不选择“不坦白”呢,如果这样的话他们不是都只判1年 刑了吗?事实上通过上述分析我们知道那是不可能的。除非在两人串 供的基础上,但我们的前提是他们被分别关押,根本没有串供的可能。 这个结果或许你会感到不能理解,但通过我上述运用博弈知识的分 析,你应该清楚了吧,而这也正是博弈论的魅力所在。
下面这个案例是老师在上课时讲过的了,我觉