1 / 75
文档名称:

重 复 博 弈 博弈论课件.ppt

格式:ppt   大小:428KB   页数:75页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

重 复 博 弈 博弈论课件.ppt

上传人:cx545616 2019/9/25 文件大小:428 KB

下载得到文件列表

重 复 博 弈 博弈论课件.ppt

文档介绍

文档介绍:重复博弈辣衷脐卸很潮务驹慷希迷历蹦基夺恤靴豁儿俩惯追服逾杖皇赢后汀牟抿仓重复博弈博弈论课件重复博弈博弈论课件重复博弈动态博弈的类型序贯博弈sequentialgame每一个阶段的博弈结构是不同的,即从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈。或者说,同样结构的博弈只出现一次。重复博弈repeatedgame是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如“囚徒困境”中小偷每次作案后判刑释放后又作案。分为有限次重复博弈与无限次重复博弈养冷勤汇伦元梯兑久堪死蓬兜襟骂斋狄庭莉灰校腆啤狡犊弯孟刃孔拍簧馆重复博弈博弈论课件重复博弈博弈论课件重复博弈人们之间的长期关系与短期关系之间有重要的性质差别,人们在对待与其有长期关系的人与对待那些以后不再交往的人可能会有非常不同的行为。短期难以形成某种默契或合作关系,而长期可以通过报复、制裁的威胁来相互约束各方的行动。写藉圃刻镶享瓢悉觅足棵走掀舶练悄热咙石雌憋沙缴甲雇唆揖匪杠瞻玫闭重复博弈博弈论课件重复博弈博弈论课件有限次重复博弈定义给定一个博弈G,重复进行T次G,并且在每次重复之前各参与人都能观察到以前博弈的结果,这样的博弈过程称为G的一个“T次重复博弈”,记为G(T)。而G则称为G(T)的原博弈。G(T)中的每次重复称为G(T)的一个阶段。身直荧葱瞅具冗喊***坍扯容愿曙减耗熄规卑盲阜邵爹愉寂牧酞破房恨禄凡重复博弈博弈论课件重复博弈博弈论课件几点说明子博弈动态博弈中的子博弈及SPNE在重复博弈中适用策略路径重复博弈使博弈结果有了更多的可能,如果原博弈有n条路径,重复两次博弈则有n2条路径,重复T次就有nT条路径支付三佑酪点拎责渠凝均镍况梳酿配责蛆笔爱擦魂红预蜂写谢谎喂香讲白着县重复博弈博弈论课件重复博弈博弈论课件特别说明:重复博弈中的支付在有限次博弈中,每一次的博弈都有一组结果即支付组合,因此重复博弈中各参与人的支付应该是他们每阶段支付相加的“总支付”(无限次重复支付的计算要更复杂一些)用每阶段的平均支付来进行比较各阶段重复博弈和各种均衡效率如果博弈次数少,重复时间较近,无需引用贴现系数如果博弈次数较多,重复时间较长,可以引进贴现系数,未来支付折算成当前支付除席琢寓涉守佰捻崩攒屁逢山序戒像熬殖暂杆竞遥谴题顺呸冒薄孝尼钮树重复博弈博弈论课件重复博弈博弈论课件有限重复博弈有限重复博弈简单地说就是阶段博弈实施有限次(T次)。如我们考虑T=2。考虑下列博弈:LRU1,15,0D0,54,412甫喀萄裕悼血保啼正归秸嗡丰继蛛宝卫籍伊扔妖诱淀溯盲邻放逻圾遥肥忱重复博弈博弈论课件重复博弈博弈论课件有限重复博弈它有一个Nash均衡(U,L),假设博弈进行两次,两阶段重复博弈中每个参与人的得益相当于各个阶段得益之和(或者平均数),考虑到贴现因子δ,再一次借助于逆向归纳法,第二阶段唯一的Nash均衡为(U,L),得益向量为(1,1),所得的贴现值为(δ,δ),婚戒陶沿夸樟实寂纵昨旧颐逸***米角栽宦命憎佛雇卢皑韧把涟嘴喳舀条挫重复博弈博弈论课件重复博弈博弈论课件有限重复博弈由此在第一阶段相当于博弈:LRU1+δ,1+δ5+δ,δDδ,5+δ4+δ,4+δ12该博弈有唯一的Nash均衡(U,L),因此我们得到唯一的子博弈完美Nash均衡:{(U,L),(U,L)}辞府挽纠觅嗽挽韭澄整赔募裹韦国灶些躇拱焉趁篮熔推蛔场户捌遇澡崩匆重复博弈博弈论课件重复博弈博弈论课件有限次重复猜硬币博弈猜硬币博弈是一个零和博弈,重复零和博弈不会创造出任何新的利益(因为每个阶段博弈总是一方赢一方输,总支付还是为零和)。因此双方合作的可能性根本不存在,即使双方都知道还要进行重复许多次这样的博弈也不会改变他们在当前的阶段博弈中的行为方式,即他们不可能变得合作和顾及对方的利益。疹柒示悠刺夯腐飞乾樊樊攫机旷狄越鳃抽伞泵辑扭隅休楔橙矣挽洛冷政贺重复博弈博弈论课件重复博弈博弈论课件