文档介绍:第11章有限重复博弈在每一个重复博弈中,有一个实施许多遍的组件博弈——有时候称作阶段博弈。博弈中的盈利是每个阶段的盈利之和修改版囚徒困境我们对标准的囚徒困境添入一个策略;除了c与n之外,每个局中人有第三个策略,设为p,表示“部分认罪”。考虑如下阶段博弈:2cnpc0,07,-23,-1n-2,75,50,6p-1,36,03,31这个博弈叫做无限重复囚徒困境;此术语归因于博弈没有固定终点这一事实。无限重复囚徒困境的盈利计算如下。假设在第t阶段,局中人i得到盈利it。在实际中实施到第t阶段的可能性是t。从而第t阶段的期望盈利是tit。总期望盈利是这些阶段博弈期望盈利之和;即,等于定义重复博弈由阶段博弈G和它的重复次数(设为T)确定。阶段博弈G是策略型博弈:其中Si是局中人i的策略集,i是他的盈利函数[它依赖于(s1,s2,…,sN)]。经济应用短期国库券拍卖。专利药品市场的竞争。NASDAQ市场制作。国际石油市场——或OPEC。有限重复博弈T次重复囚徒困境的唯一子博弈完美均衡是,在每一突发事件中局中人认罪。假如修改版囚徒困境进行T次。考虑如下策略对:从(n,n)开始,除了最后一次以外,在所有阶段继续取(n,n)[在最后阶段,采取(p,p)]。沿着所提供的这个程序,没有一个局中人会偏离它(并在首T个阶段中的任何一个阶段中采取非n的其他策略)。倘若发生了偏离,从随后的阶段起并一直下去都采取(c,c)。所述的策略是子博弈完美均衡。命题考虑有限重复博弈(G,T),其中G={Si,i;i=1,2,…,N}。假如阶段博弈G恰好只有一个纳什均衡,设为(s1*,s2*,…,sN*)。那么重复博弈有唯一的子博弈完美均衡。在这个均衡中,不管局中人i或其他任何局中人,在任何一个以前的阶段中采取了什么样的行动,局中人i在T个阶段的每一个中都取si*。