1 / 11
文档名称:

博弈论知识点总结.docx

格式:docx   大小:61KB   页数:11页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

博弈论知识点总结.docx

上传人:世界末末日 2024/6/26 文件大小:61 KB

下载得到文件列表

博弈论知识点总结.docx

相关文档

文档介绍

文档介绍:该【博弈论知识点总结 】是由【世界末末日】上传分享,文档一共【11】页,该文档可以免费在线阅读,需要了解更多关于【博弈论知识点总结 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。名师整理 精华学问点博弈论学问总结博弈论概述:1、博弈论概念:博弈论:就是争论决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论争论的假设:1、决策主体是理性的,最大化自己的收益。2、完全理性是共同学问3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。行动:参与人的决策选择战略:参与人的行动规章,即大事与决策主体行动之间的映射,也是参与人行动的规章。信息:参与人在博弈中的学问,尤其是其他决策主体的战略、收益、类型〔不完全信息〕等的信息。完全信息:每个参与人对其他参与人的支付函数有准确的了解;完善信息:在博弈过程的任何时点每个参与人都能观看并记忆之前各局中人所选择的行动,否则为不完善信息。不完全信息:参与人没有完全把握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。支付:决策主体在博弈中的收益。在博弈中支付是全部决策主题所选择的行动的函数。从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区分:3、博弈论与传统决策的区分:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,争论工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消费者可支配收入。2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依靠于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依靠于其他决策者的选择和效用函数。4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种标准性描述,有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进展选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。1、参与人集合G = {1,2,..., n}:2、每位参与人非空的战略集Si3、每位参与人定义在战略组合?ns =(si 1,..., si,..., sn)上的效用函数Ui(s1,s2,…,sn).名师整理 精华学问点扩展式博弈:是博弈问题的一种标准i性=1描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更留意对参与人在博弈过程中遇到决策问题时序列构造的分析。包含要素:1、参与人集合G = {1,2,..., n}名师整理 精华学问点2、参与人的行动挨次,即每个参与人在何时行动;3、序列构造:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息;4、参与人的支付函数。比较:1、战略式博弈从本质上来讲是一种静态模型。2、扩展式博弈从本质上来讲是一种动态模型。5、博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1、合作博弈〔强调团体理性、团体最优决策、效率〕2、非合作博弈〔强调个人理性,个人最优决策〕按参与人行动先后挨次可分为:1、静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知道其他参与人所选择的行动。2、动态博弈:参与人的行动有先后挨次,后行动者获得先行动者的行动信息。按参与人对信息的把握程度可分为:1、完全信息:每个参与人对其他全部参与人的特征、战略空间及支付函数有准确的了解,博弈开头时不存在不确定性因素。2、不完全信息:参与人没有完全把握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。按决策主体对信息的把握程度和行动的先后挨次,博弈可以分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。静态 动态名师整理 精华学问点完全信息不完全信息完全信息静态博弈均衡:纳什均衡不完全信息静态博弈均衡:贝叶斯纳什均衡完全信息动态博弈均衡:子博弈精炼纳什均衡不完全信息动态博弈均衡:精炼贝叶斯纳什均衡名师整理 精华学问点息静态博弈在性6、依据所学这四种博弈的特点对这四种博弈做一个比照分析:类型信息和行动特点均衡均衡类型特别均衡求解方法学过的例子性质完全信每个参与人对其纳什均纯战略纳占优战略纳箭头法Hotelling价格竞多重性和存他全部参与人的衡什均衡什均衡划线法争特征、战略空间及(PNE)〔DSE〕库诺特价格竞争支付函数有准确重复剔除的不断剔除劣一般一个博弈中的了解,博弈开头占有均衡战略〔弱劣存在参与者有多时不存在不确定(IFDE)战略的剔除个行动时可以先性因素,参与人同挨次会影响考虑能否剔除弱时行动或者不是均衡结果战略简化博弈同时行动但是后混合战略聚点均衡支付最大化社会福利博弈行动者不知道行纳什均衡法小偷-保卫博弈动者的行动信息。战略和行动一样。(MNE)支付等值法名师整理 精华学问点完全信息动态博弈在博弈开头之前子博弈参与人之间的信精炼纳炼纳什均博弈均衡的唯一性有息不存在不确定什均衡衡关性,但是参与人行动存在先后挨次。在完全信息动态博弈中,为了表示参与人之间的信息把握关系,引入子博弈精有限次重复无限次重复博弈均衡〔无名氏定理〕一般博弈与纳什均衡与贴现因子有关逆向归纳法连锁店悖论囚徒逆境〔冷酷战略〕无限期轮番讨价还价模型斯坦科尔伯格寡1、均衡结果是原博弈的Nash均衡;2、同时在了信息及的概念。求解头竞争雇主与公会之间的竞争在博弈开头之前贝叶斯贝叶斯纳混合战略对原混合战性别战1、均衡存在参与人之间的信纳什均什均衡〔不完全信略参加少许***存在不确定性,衡息状况下纯不确定性因2、不确定性但是参与人同时战略均衡的素,求极限。表达为类型行动或者不是同极限〕的不确定性时行动但是后行动者不知道行动一般贝叶斯Harsanyi转机制设计者的行动信息。均衡换不确定是参与人的了性的不确定性在博弈开头前参精炼贝信号传递分别均衡依据所得信信号传递博弈不完全信息与人之间的信息叶斯纳博弈息修正推断不完全信息重复动态博弈子存在不确定性,同什均衡混淆均衡概率,依据博弈与声誉博弈精炼纳时参与人行动存收益最大化Milgrom-Roberts什均衡与海在先后挨次。不完全信息动态博弈准分别均衡决策垄断限价模型萨尼不完全信息静态博过程不仅是参与弈贝叶斯均人选择行动的过衡的结合。程,而且是参与人不断修正信念的过程。每一个子博弈上构成Nash均衡名师整理 精华学问点名师整理 精华学问点不完全信息静态博弈不完全信息动态博弈二、四种博弈类型具体分述1、完全信息静态博弈完全信息静态博弈特点:每个参与人对其他全部参与人的特征、战略空间及支付函数有准确的了解,博弈开头时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动一样。完全信静态博弈相关概念:以产品开发博弈举例说明:名师整理 精华学问点参与人:参与人1和2。参与人的集合卡表示为:Γ={1,2,…n}.表示全部参与人的集合,在产品开发博弈中为:Γ={1,2}行动:开发、不开发。Ai表示参与人行动的集合。产品开发博弈中参与人的行动集合为A1=A2={a,b},其中a为开发,b为不开发。a={a1,a2…an}表示参与人的行动组合。产品开发博弈中为:A={〔a,a〕,(a,b),(b,a),(b,b)}战略:参与人的行动规章。在博弈中的战略可以定义为从观测集到行动集的映射关系,即:Si:Xi—Ai。用Si={si}表示参与人全部战略的集合。在n人博弈中,用S=(s,s,s…,s)表示n个参与人的战略组合,它表示博弈中每个参与1 23 n人实行战略si的一种博弈情形。在完全信息静态博弈中,由于不存在决策时序上的差异,全部参与人在同一决策时点即博弈开头的那一时刻决策,因此,全部参与人面临的决策情形都只有一种,所以,参与人的战略集与行动集一样。支付:是指参与人在博弈中的所得。一般状况下也是用效用函数来表示参与人在博弈中的所得。因此,参与人的支付就可表示为一种特定博弈情形下参与人得到确实定效用水平或期望效用水平。支付一般用ui(1,2,…,n)表示参与人i的支付(效用水平),支付组合u=(u1,u2,…un)表示参与人在特定博弈情形下所得到的支付,其中为参与人i的支付。因此,参与人i=(i=1,2,…,n)的支付就可表示为:ui=ui(s,s).i -i信息:是参与人所具有的有关博弈的全部学问,如有关其它参与人行动或战略的学问、有关参与人支付的学问等等。在“产品开发博弈”中,假设两个企业都知道市场需求,那么这样的博弈情形就是我们前面所提到的完全信息假设;假设两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。纯战略纳什均衡纯战略:参与人在给定信息下只选择一种特定〔或确定性〕的战略混合战略:混合战略解释了一个参与人对其他参与人所实行的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。纯战略纳什均衡中包括:占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。1、占优均衡占优战略:参与人的最优战略si*与其他参与人的选择s无关。无论其他参与人选择什-i么战略,参与人的最优战略总是唯一的,这样的最优战略称之为“占优战略”。名师整理 精华学问点在n人博弈中,假设对于全部的其他参与人的选择s-i,si*都是参与人i的最优选择名师整理 精华学问点- -u(s*,s )>u(s,s )i i i i i i则称si*为参与人的占优战略。在n人博弈中,假设对全部参与人都存在占优战略si*,则占优战略组合si*=〔s1*si2*,…,sn*〕称为占优战略均衡。假设全部参与人都有占优战略存在,那么占优战略均衡就是唯一的全部理性参与人可以推测到的博弈结果。2、重复剔除劣战略假设在一个博弈中,参与人不存在占优战略,但是参与人i存在两个战略,其中一名师整理 精华学问点u(si i¢,s-i)>ui(s¢,s )i -i名师整理 精华学问点个战略叫另一个战略的所得效用要大,则理性的参与人确定不会选择战略。名师整理 精华学问点严格劣战略:u(si i¢,si)>ui(s¢,s )i -i名师整理 精华学问点u(si¢,si)3ui(s¢,s )i -i名师整理 精华学问点弱劣战略:假设重复剔除过程始终可持续到只剩下唯一的战略组合,则该战略组合即为重复剔除的占优均衡,此时该博弈是重复剔除战略可解。要点:再重复剔除过程中,假设每次剔除的是严格劣战略,均衡结果与剔除挨次无关;假设剔除的是弱劣战略,均衡结果可能与剔除挨次有关。3、一般Nash均衡Nash均衡是完全信息静态博弈的解的概念,在完全信息静态博弈中,构成Nash均衡的战略是不行剔除的,即不存在任何一个战略严格优于Nash均衡战略。求解纳什均衡的方法划线法、箭头法。划线法:1、考察参与人1的最优战略2、用上述方法找出参与人2的最优战略3、找出最优战略组合箭头法:1、对于每个战略组合,检查是否有参与人会偏离这个战略组合2、直至找出没有参与人会偏离的战略组合纯战略均衡反映函数:各博弈方选择的纯策略对其他博弈方纯策略的反响。名师整理 精华学问点 混合战略纳什均衡混合战略:在博弈G={G;S,...,S;u,...,u} 中,对任一参与人i,设Si={S1,…,Sk},则参与人名师整理 精华学问点1 n 1 n i ii的一个混合战略为定义在战略集Si上的一个概率分布δi={δi1,…,δik},其中δ ji名师整理 精华学问点〔j=1,…,k〕表示参与人i选择战略表示参与人i选择战略Sji满足0≦δ j≦1,其中概率之和为1。i支付:混合战略的支付为各种概率下收益的加权平均。混合战略纳什均衡:的概率的概率,即δ ji名师整理 精华学问点在博弈G={G;S,...,S;u,...,u}中,混合战略组合δi={δ1*,…,δn*}为一个Nash名师整理 精华学问点均衡。当且仅当"1i?G,"ns1?Sn,有v(s*,s*)3v(s,s) 。*名师整理 精华学问点i i混合战略Nash均衡的求解:支付最大化法;支付等值法;i i -ii i -i名师整理 精华学问点混合战略均衡反映函数:在混合策略的范畴内,博弈方的决策是选择概率分布,因此,反响函数就是一方对另一方选择的概率分布的反响。聚点均衡:在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来到达一个“聚点”均衡。这些信息可能与社会文化****惯、参与人过去博弈的历史有关。不同均衡概念之间的关系:占优均衡<重复剔除劣战略均衡<纯战略纳什均衡<混合战略纳什均衡纳什均衡的多重性与存在性存在性:每个有限战略式博弈〔参与人与相应的战略集均为有限〕必存在纳什均衡,这个均衡可能是纯战略纳什均衡,也可能是混合战略纳什均衡。多重性:一个博弈可能有多个均衡,博弈论并没有一个一般的理论证明,哪一个纳什均衡结果肯定能消灭。名师整理 精华学问点2、完全信息动态博弈完全信息动态博弈特点:在博弈开头之前参与人之间的信息不存在不确定性,但是参与人行动存在先后挨次。在完全信息动态博弈中,为了表示参与人之间的信息把握关系,引入了信息及的概念。完全信息动态博弈有关概念:名师整理 精华学问点信息集:信息集Ii是参与人i决策结的一个集合,它满足以下两个条件:名师整理 精华学问点1、I中的每个决策结都是参与人i的决策结;i名师整理 精华学问点2、当博弈到达Ii时,参与人i知道自己处在该信息集中的某个决策结,但不知道是哪名师整理 精华学问点一个。在博弈树中,属于同一信息集的决策结一般用虚线连接起来。结:包括决策结和终点结两类。决策结是参与人实行行动的点时点,终点结是博弈行动路径的终点。一个信息集可能只包含一个决策结,也可能包含多个决策结。假设只包含一个决策结的信息集就是但单结信息集。假设博弈中全部信息集都是单结的则成为完善信息博弈。子博弈:是原博弈的一局部,它始于原博弈中一个单结信息集中的决策结x,并由决策结x及其后续结共同组成。1、子博弈可以作为一个独立的博弈进展分析,并且与原博弈具有一样的信息构造;2、原博弈可以作为自身的一个子博弈;不完全信息静态博弈均衡——子博弈精炼Nash均衡:解决Nash均衡多重性问题的一种主要方法就是精炼的方法,即在Nash均衡的根底上,通过定义更加合理的博弈解并剔除不合理的均衡。子博弈精炼纳什均衡的引入就是将那些包含不行置信威逼战略的纳什均衡从均衡中剔除,从而给出动态博弈结果的一个合理推测。即子博弈精炼纳什均衡要求均衡战略的行为规章在每个信息集上都是最优的。扩展式博弈的战略组合s* (s*,...,s*),是一个子博弈精炼Nash均衡,当且仅当满1 n足以下条件:1、是原博弈的Nash均衡2、在每一个子博弈上构成Nash均衡一个战略组合是子博弈精炼Nash均衡当且仅当它对全部的子博弈(包括原博弈)构成Nash均衡,同时也意味着原博弈的Nash均衡并不肯定是子博弈精炼Nash均衡,除非它还对全部子博弈构成Nash均衡。不完全信息静态博弈均衡求解——逆推归纳法逆推归纳法是最常用的求解子博弈精炼Nash均衡的方法,其步骤为:其中Γ(x)代表博弈中由最底层到博弈起点的挨次,以Γ(x)为最底层,则有:i 31、找出博弈的全部子博弈;2、依据博弈进程的“反方向”逐一求解各个子博弈,即最先求解最底层的子博弈,再求解上一层的子博弈, ,直至原博弈。由于逆推归纳法对各个子博弈逐一进展求解,因此,逆推归纳法所得到的解在各子博弈上构成Nash均衡,即意味着逆推归纳法所得的解为子博弈精炼纳什均衡完全信息动态博弈中承诺行动的均衡结果分析:承诺行动:就是在博弈开头之前参与人实行某种转变自己支付或战略空间的行动,该行动使原本不行信的威逼变得可信。但是参与人的承诺行动是有本钱的,否则这种承诺就不行信。名师整理 精华学问点例子:挟制诉讼挟制诉讼就是指那种原告几乎不行能胜诉而其惟一的目的是期望通过私了而得到一笔赔偿的诉讼。该博弈的结果为原告选择不指控,博弈完毕。博弈的结果似乎与人们观测到的现实并不相符,由于现实中人们常常看到各种“挟制”发生。在上述模型中,“挟制”之所以没有成功,关键在于原告将会起诉的威逼并不行信。要是威逼变得可信,就必需实行承诺行动〔漂浮本钱〕。这样参与人的威逼就会变得可信,从而使其他博弈参与人转变策略。重复博弈议题:1、将来可信的威逼或承诺如何影响到当前的行动2、在一次博弈中无法实现的均衡,在重复博弈中能否实现有限次重复博弈:对于给定的阶段博弈G,令G(T)表示G重复进展T次的有限重复博弈,并且在下一次博弈开头前,全部以前博弈的进程都可被观测到。有限次重复博弈均衡结论:假设阶段博弈G有唯一的Nash均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进展。而且在有限次重复博弈中,假设在单阶段博弈中均衡解不只有一个,则对将来行动所作的可信威逼或承诺可以影响到当前的行动。无限次重复博弈:给定一阶段博弈G,令G(∞,δ)表示相应的无限重复博弈,其中G将无限次的重复进展,且参与人的贴现率为。对每个t,之前t-1次阶段博弈的结果在t阶段开头进展前都可以被观测到,每个参与人在G(∞,δ)中的收益都是该参与人在无限次的阶段博弈中所得收益的现值。无限次重复博弈的解——无名氏定理:令G为一个n人阶段博弈,令〔e1,e2,…,en〕为G的一个Nash均衡下的收益,且用(x1,x2,…,xn)表示G的其它任何可行收益,表示可行收益的集合。假设存在x>e, 对"i,x?Xi i i则存在贴现率δ,使无限重复博弈G(∞,δ)存在一个子博弈精炼Nash均衡,其平均收益可到达(x1,x2,…,xn)。无名氏定理的解释:在无限次重复博弈中,假设参与人具有足够的急躁〔只要d满足肯定的条件〕,那么任何满足个人理性的可行收益向量都可以通过一个特定的子博弈精炼Nash均衡得到。影响重复博弈结果的因素:影响重复博弈结果的是重复的次数和信息的完备性。子博弈精炼Nash均衡与Nash均衡的区分:由于子博弈精炼Nash均衡在任一决策结上都能给出最优决策,这也使得子博弈精炼纳什均衡不仅在均衡路径(即均衡战略组合所对应的路径)上给出参与人的最优选择,而且在非均衡路径(即除均衡路径以外的其它路径)上也能给出参与人的最优选择。即子博弈精炼Nash均衡不会含有参与人在博弈进程中不合理的、不行置信的行动。3、不完全信息静态博弈不完全信息静态博弈特点:在博弈开头之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。在不完全信息静态博弈中,在博弈开头前存在关于博弈人信息的不确定性,这个不确定像通常是博弈参与人的类型。名师整理 精华学问点在市场进入博弈中不完全信息表现为:在位者的本钱类型〔高本钱、低本钱〕在斗鸡博弈中不完全信息表现为:参与人的性格类型〔强硬,脆弱〕海萨尼转换由于在不完全信息静态博弈中,参与人的类型存在不确定性,所以当一个参与人并不知道在与谁博弈时,博弈的规章是无法定义的,海萨尼提出了海萨尼转换解决这种不确定的问题。解决方法:海萨尼指出,引入虚拟参与人——自然,由自然先打算参与人的不同类型,将不完全信息博弈转换为不完善信息博弈。海萨尼通过引入“虚拟”参与人,将博弈的起始点提前,从而将原博弈中参与人的事前不确定性转变为博弈开头后的不确定性。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法称为Harsanyi转换。海萨尼转换留意要点:1、海萨尼转换规定:参与人关于“自然”选择的推断为共同学问。2、“自然”的选择。在一般的不完全信息博弈问题中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。除了依据参与人的支付来划分参与人的类型以外,还可以依据参与人的行动空间,甚至依据参与人把握信息的多少(或程度)来划分参与人的类型。3、参与人关于“自然”选择的推断是基于自己类型推断的条件概率。不完全信息静态博弈均衡——贝叶斯纳什均衡贝叶斯博弈的定义:贝叶斯博弈包含以下五个要素:1、参与人集合BΓ={1,2,…,n}2、参与人的类型集合T,…,T1 2名师整理 精华学问点3、参与人关于其他参与人类型的推断P(t|t),…,Pn(t|t)名师整理 精华学问点1 -1 1-1n n名师整理 精华学问点4、参与人类型相依的行动集A(t),…,A(t)1 n5、参与人类型相依的支付函数贝叶斯博弈的战略:在贝叶斯博弈G={Γ;(Ti);〔P〕;〔A〔t〕;〔ui〔a〔t〕;t〕}i i i中,参与人i的一个战略是从参与人的类型集T到其行动集的一个函数s(t);它包含i i i了当自然赐予i的类型为t时,i将从可行的行动集A(t)中选择的行动。i i i贝叶斯博弈的时间挨次:1、“自然”选择参与人的类型组合t=(t,…,t)1 n2、参与人同时选择行动,每个参与人i从行动集A(t)中选择行动a(t)i i i i3、参与人i得到支付贝叶斯纳什均衡:在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型t而不知道其他参与人的类型时,给定其他参与人的战略s,他将选择使自己期望效i -i用(支付)最大化的行动a*(t),其中名师整理 精华学问点ia*(ti)?arg max v(a,s;t)名师整理 精华学问点i i a?A(t) ii -i i名师整理 精华学问点贝叶斯博弈纳什均衡的存在性:i i i名师整理 精华学问点一个有限的贝叶斯博弈肯定存在贝叶斯Nash均衡。贝叶斯博弈与混合战略均衡〔关于混合战略纳什均衡的一个解释〕首先,混合策略均衡不是现实生活的一个合理描述,人们并不是依据概率分布来选择自己行动;海萨尼证明,在完全信息状况下的混合策略均衡可以解释为不完全信息状况下纯策略均衡的极限。混合策略的本质:名师整理 精华学问点混合策略的本质不在于参与人随机的选择行动,而在于他不能确定其他参与人将选择什么纯策略,这种不确定性可能来自于参与人不知道其他参与人的类型。海萨尼的根本思想:只要在原来的博弈中参加少许不完全信息因素,使得参与人的支付函数中的收益不再是确定的,而是和一个有范围的不确定参数有关,从而通过将混合战略均衡求解转换为贝叶斯均衡的极限解,但是得到的纯战略贝叶斯均衡就与完全信息下的混合战略均衡相像。结论:完全信息博弈的混合战略Nash均衡可以解释为与之亲热相关、存在一点点非完全信息的纯战略贝叶斯Nash均衡。同时海萨尼给出了描述混合策略和纯策略之间关系的一个正式的定理:混合策略均衡的纯化定理。贝叶斯均衡Eg:机制设计问题机制设计问题实际上就是探讨设计者如何向参与人供给鼓励,以促使参与人向设计者透露其把握的信息〔说真话〕,从而确定对设计者有利的结果的问题。这一机制对应于一个博弈形式,设计者需要设计出一个博弈形式,让参与人在这个博弈形式下进展博弈从而实现他的目标。博弈形式不同,实现目标的程度也不一样,设计者必需选择对他来说是最有利的博弈形式,即最有利的机制。机制设计的根本模型:机制设计是典型的3阶段不完全信息博弈,期阶段如下:阶段1:机制设计者(托付人)设计一种“机制”,或者“契约”,或者“鼓励方案”;阶段2:代理人选择承受或拒绝该机制,拒绝的代理人得到某个外生的“保存效用”;阶段3:承受机制的代理人选择自己的行动(或者战略),实现一个博弈结果。机制设计模型中的有关概念:参与约束:由于代理人在其次阶段总可以选择不承受该机制从而获得一个保存效用,因此,代理人承受这个机制获得的效用必需不小于拒绝这个机制时获得的效用。鼓励相容约束:这意味着,对于代理人而言,代理人真实报告自己的类型时获得的效用必需不小于谎报自己类型时获得的效用。可行机制:满足参与约束的机制被称为可行机制。可实施机制:满足鼓励相容约束的机制称为可实施机制可行的可实施机制:假设一个机制既满足参与约束,又满足鼓励相容约束。机制设计的目的:机制设计的目的就是要设计出可行的可实施机制,从而在该机制中找出最优规章以追求最大化收益。4、不完全信息动态博弈不完全信息动态博弈特点:在博弈开头之前参与人之间的信息存在不确定性,同时参与人行动存在先后挨次。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。不完全信息动态博弈的有关概念类型:是指参与者的类型。在不完全信息动态博弈中自然首先选择参与人的类型。动态博弈:行动有先有后。所以后行动者可以观看到先行动者的行动信息,从而可以修正自己对于参与人的类型的信息的推断。类型相依:参与者的行动传递着有关自己的类型的信息,对方可通过参与人的行动来推断自己的最优行动。先行动者推测到自己的行动被后行动者利用,就会设法传递对自己最有利的信息。名师整理 精华学问点不完全信息动态博弈的纳什均衡——精炼贝叶斯均衡对应于不完全信息动态博弈的纳什均衡称为精炼贝叶斯均衡;精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。1、不完全信息动态博弈均衡求解的根本思路:不完全信息动态博弈将子博弈精炼Nash均衡中“均衡精炼”的思想应用到不完全信息扩展式博弈中,但是有提前条件:1、对每个参与人i,在其信息集上给出关于自己位于该信息集中哪一个决策结的信念(或推断)。2、对参与人i的每个信息集,在给定参与人i在该信息集上的信念(或推断)状况下,参与人的战略是对其他参与人战略的一个最优反响。与静态博弈不同的是:在观测到先行动者第一阶段选择后,后行动者可以修正对先行动者类型的先验概率,由于先行动者的行动可能包含其类型的信息,即行动就是类型的反映,不同的行动反映不同的类型信息。参与人最初对于对手类型信息概率的推断成为先验概率,对于依据行动反映出得信息修正后的概率成为后验概率。先验概率(priorprobability):修正之前的推断;后验概率(posteriorprobability):修正之后的推断先验概率和后验概率的转化是依据贝叶斯法则计算:在不完全信息动态博弈博弈均衡解的求解过程中,假设不行置信的威逼,均衡就是不合理的,所以要对均衡结果精炼,剔除那些不行置信的威逼。从而引入子博弈精练纳什均衡的概念,但是,在不完全信息动态博弈中,只有一个子博弈,不能将上述方法直接用于求不完全信息动态博弈的均衡解。合理的均衡应当是满足:给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈上构成贝叶斯均衡,我们将通过这种方式得到的纳什均衡称为精炼贝叶斯纳什均衡。精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼纳什均衡和贝叶斯推断的结合,精炼贝叶斯均衡要求:1、 在每个信息集上,决策者必需有一个定义在属于该信息集的全部决策结上的一个概率分布〔信念〕2、 每一个参与人依据贝叶斯法则和均衡战略修正后验概率3、 给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必需是最优的。3、精炼贝叶斯纳什均衡:满足条件:1、对于全部的参与人i,在每一个信息集h上,存在名师整理 精华学问点s*(s ,qi -i i)?argmax?p(qq i -ia h)ui i(s,s ,q)i -i i名师整理 精华学问点2、~p(q sh) 是使用贝叶斯法则从先验si概率,-ip(q?q)、观测到的ah和最优战略s*(.)名师整理 精华学问点i -i -ii -i i -i -i名师整理 精华学问点得到的。精炼贝叶斯纳什均衡是均衡战略和均衡信念的结合,给定信念p=〔p*,…,p*〕,战1 n名师整理 精华学问点略s*〔=s*,s*,…,s*〕是最优的, 给定战略s*〔=1 2 ns*,s*,…,s*〕,信念p*〔=1 2 np*,…,p*〕1 n名师整理 精华学问点是使用贝叶斯法则从均衡战略和所观测到的行动得到的。名师整理 精华学问点