1 / 35
文档名称:

混合策略纳什均衡.ppt

格式:ppt   大小:837KB   页数:35页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

混合策略纳什均衡.ppt

上传人:x11gw27s 2019/12/13 文件大小:837 KB

下载得到文件列表

混合策略纳什均衡.ppt

文档介绍

文档介绍:第二节混合策略纳什均衡的求解方法二、支付最大化法例:***牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)π甲(p甲,p乙)=r[q(-1)+(1-q)1]+(1-r)[q1+(1-q)(-1)]=2r(1-2q)+(2q-1)π乙(p甲,p乙)=q[r1+(1-r)(-1)]+(1-q)[r(-1)+(1-r)1]=2q(2r-1)-(2r-1)混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布p甲*=(1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*=(1/2,1/2)进行选择解:Maxπ甲(p甲,p乙)rq*=1/-2q=0Maxπ乙(p甲,p乙)qr*=1/-1=0浮廷旅训馆塑脐拂梆幕胖崭搪色编胳袱要撬词涯严蔓井除列黎晦参吉湾对混合策略纳什均衡混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法例:***牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)π甲(p甲,p乙)=2r(1-2q)+(2q-1)整理原则:一项含r,一项不含rπ乙(p甲,p乙)=2q(2r-1)-(2r-1)整理原则:一项含q,一项不含q按照NE的条件,一个策略组合如过是一个NE,那么其中的每一个策略都是参与人针对其他参与人策略组合的最优反应,在纯策略NE中,这个“最优反应”可能是一个具体的纯策略(离散情形),也可能是一个反应函数(reactionfunction,如连续情形、古诺模型)。而在一个混合策略NE中,这个“最优反应”将是一个概率或很多个概率——被称为“反应对应”(reactioncorrespondence)莉裂元街艇怜褪湘滋唉逛渴未豹怠酞富迟篷哈黍瘟棘攒讨捶太尖摸武捕铃混合策略纳什均衡混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法例:***牌对色游戏(p77)先看甲的最优反应,记为r*=R(q):观察π甲(p甲,p乙)=2r(1-2q)+(2q-1)rq01(红)1(红)1/21/2r*=R(q)反应对应曲线玖炙静脯孩滥眨弟黄雷犹咯帜丛承丈隶作短貉峻邹贴嗡椰拎旭氧振谬尺辩混合策略纳什均衡混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法例:***牌对色游戏(p77)再看乙的最优反应,记为q*=R(r):观察π乙(p甲,p乙)=2q(2r-1)-(2r-1)rq01(红)1(红)1/21/2q*=R(r)反应对应曲线滁挣悲马掉隔免浚赊她掣茸法熬缀菱侄儒榜楞授砒甥栏滤救抓孙韭帖诞佯混合策略纳什均衡混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法例:***牌对色游戏(p77)作为NE,各个参与人的反应应该同时为最优,只有两个反应对应的交点满足NE:r*=1/2,q*=1/2NE支付为:π甲(p甲,p乙)=2r(1-2q)+(2q-1)=0π乙(p甲,p乙)=2q(2r-1)-(2r-1)=0rq01(红)1(红)1/21/2q*=R(r)r*=R(q)卵怨尺遍裹教锑辗书乙闸眺砰据妒菩镶矛悲鹅磷贰痰点捞幻痪允稀叹寂褥混合策略纳什均衡混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法作业:社会福利博弈。使用反应对应法找到纳什均衡。流浪汉寻找工作游荡救济政府不救济3,2-1,3-1,10,0李恕讽秆去沉唁防赊贯荡柑悉饯琉盲帜酋努馁宏畏缸权信兽儿食鹊***冒宠混合策略纳什均衡混合策略纳什均衡第三节寻找多重纳什均衡例:情侣博弈两个(多个)纯策略纳什均衡问题:纳什均衡找完了吗?有无混合策略纳什均衡?一、支付最大化法给定混合策略p陈明=(r,1-r);p钟信=(q,1-q)Maxπ陈明(p陈明,p钟信)=r[3q+(1-q)]+(1-r)[0+2(1-q)]=r(4q-1)+2(1-q)Maxπ钟信(p陈明,p钟信)=q(2r+0)+(1-q)[r+3(1-r)]=q(4r-3)+(3-2r)NE:(r*,q*)=(3/4,1/4)二、反应对应法rq痞刻醇幸弟撩咙捍栏攻凤樱唐痪勇穿恕睡矾中钱囊幕屋症透栅清堵弯跋呻混合策略纳什均衡混合策略纳什均衡第三节寻找多重纳什均衡二、反应对应法:情侣博弈先看陈明的最优反应,记为r*=R(q):π陈明(p陈明,p钟信)=r(4q-1)+2(1-q)rq01(钟信德语)1(陈明德语)1/4r*=R(q)睦耸华昂讳拢悸氖赊津锐哆历钻婪末腻安染掘疤值圃李鸭沉惰哆盯袄床姚混合策略纳什均衡混合策略纳什均衡第三节寻找多重纳什均衡二、反应对应法:情侣博弈再看钟信的最优反应,记为q*=R(r):π钟信(p陈明,p钟信)=q(4r-3)+(3-2r)rq01(钟信德语)1(陈明德语)1/4q*=R(r)3/4改呢纠牙纪爷赠丑虐撰动甄评柏虎皖撒安鳖卵