文档介绍:第11章 有限重复博弈
在每一个重复博弈中,有一个实施许多遍的组件博弈——有时候称作阶段博弈。
博弈中的盈利是每个阶段的盈利之和
修改版囚徒困境
我们对标准的囚徒困境添入一个策略;除了c与n之外,每个局75, h 50h , 50h 75l , 25l
75, l 25l , 75l 50l , 50l
 缩小了的多重价格拍卖:
购买者2 75, h 75, l
75, h 50h , 50h 75h , 25l
75, l 25l , 75h 50l , 50l
购买者1
购买者1
情况I:竞争的情况
假设,即使以低价格购买一半数量是无利可图的;即,假如50h > 25l。那么在缩小了的单价拍卖中h是优策略。因此阶段博弈中唯一的纳什均衡是(h, h)。财政部特别喜欢,因为在每一个阶段中的(h, h)也就成为唯一的子博弈完美。(为什么?)如财政部所作的那样,重复拍卖,使得在市场上竞争的剧烈程度不起作用并且不允许参与者为保持低价格而作确实有效的交易。
现在考虑缩小的多重价格拍卖。如果对于低价格的最优反应也是出低价,即,如果50l> 75h,那么这次就可能有第二个纳什均衡了。在那种场合,(l, l)也是纳什均衡;即,购买者企图无保留地进行串通,使价格保持低位。因而一个子博弈完美均衡是双方购买者一直都出价l。
情况II:共谋串通情况
在多重价格拍卖中,l是优策略(从而,购买者由于报低价而“亏待”财政部)。
在单价拍卖中,阶段博弈存在唯一的混合策略纳什均衡.
唯一的阶段博弈均衡策略也是唯一的子博弈完美均衡策略。因此,在多重价格拍卖中,(l, l)被重复地实施,而在单价拍卖中,l和h的对等混合(纳什均衡)重复地实施。因为在后者均衡中,财政部发现至少在某些时候为高价格,显然财政部觉得这样更可取。
总的来说,单价拍卖总是受到财政部的青睐。在竞争场合,它一直确保高价格,而在共谋串通情况,有些时候保证高价格。
第12章 无限重复博弈
折扣
局中人i的总折扣盈利 为
有关折扣总和的一个事实是非常有用的:
事实1:当每个阶段的阶段博弈盈利都等于1时,总和1 + + 2+ … + t + …等于
因此,当阶段博弈盈利为常数,比方,那么总和等于
触发策略和好行为
囚徒困境阶段博弈周而复始地进行,没有明确的最后阶段。
考虑如下策略对,每个局中人对应一个策略:由采用(n, n)开始。如果在任何阶段没有一个局中人认罪,那么继续采用(n, n)。但是,如果在某个阶段两个局中人中只要有一个认罪,那么从此以后每个阶段一直采用(c, c)。像这样的策略称为严厉的触发策略:对可取行动(n, n)的偏离,开启了“惩罚阶段”(c, c)。触发在下述意义下是严厉的,惩罚阶段一旦开始,决不撤消。
对于严厉触发策略,实际上只有两类子博弈——(1)在首t个阶段重复采用(n, n)之后的子博弈,和(2)其它的子博弈。
对于类型(2),策略明确说明从此以后都采用(c, c)。在这个子博弈里面,它的确是纳什均衡。没有一个局中人能在任何阶段通过取n来对付c从而增加自己的盈利;而且,他不会改变今后预期的行动方式。
对于类型(1)的子博弈,让我们检查一下局中人在任何阶段是否有认罪的动机——而其他的局中人在那个阶段取的是n。做这样的事将给认罪的局中人带来眼前的盈利7,但在以后的每一个阶段结果盈利为0。(为什么?)继续采用这个策略将为这个局中人产生当前阶段的盈利5和未来每一个时期中一连串的盈利5。因而,继续采用这个策略的总盈利为
显然,只要 ,即,只要 大于 2/7 ,继续采用所提出的严厉触发策略较好一些。
在无限重复博弈中“好”是可以持续的,因为在每一个阶段有可能做出有条件的好人承诺——如果今天你“好”,那么明天我也“好”。(伴随的威胁是,如果今天你“恶”,那么此后我一直“恶”。)承诺保证了盈利5的持续不断;凶恶地威胁表明了从此以后盈利降为零。 如果一个局中人单方面决定今天当一回恶人,那么在他们中间,构成了将来损失5 /(1- )的盈利。如果很在乎未来,即,如果 大的话,这种“大棒胡萝卜”是十足的威慑。
严厉的触发策略由两个部分组成:第一,存在严厉的惩罚,永远地(c, c)下去。第二,存在可取的“好人”行为,永远地(n, n)。对可取行为的任何背离会触发惩罚。如果 足够地大,那么严厉惩罚是十足的威慑以及“好人”行为是可以如愿以偿的。
严厉惩罚的威慑也可以有助于实现其他行为。
伴随不同的(和不太苛刻的)惩罚,“好人”行为也许是可实现的。