
纯策略纳什均衡是指在一个纯策略组合中,如果给定其他策略不变,节点不会单方面改变自己的策略,否则不会使节点访问成本变小。纳什均衡又称非合作博弈均衡,是博弈论的重要术语,以约翰纳什(johnf nash)命名。
在一场博弈的过程中,无论对手的策略如何选择,都会有一方选择某种策略,这种策略称为优势策略。如果双方在两个博弈中的策略组合构成了各自的优势策略,那么这个组合就定义为纳什均衡。
如果重复博弈存在唯一的纯策略纳什均衡,如何求其纯策略纳什均衡?先看下面这个囚徒困境博弈的例子:
我们现在考虑博弈重复两次的重复博弈,可以理解为给囚犯两次坦白的机会,最后的收益是两阶段博弈中各自收益的总和。在两场比赛的过程中,双方都知道第一场比赛的结果,然后进行第二场比赛。用逆向归纳法分析,先分析第二阶段,也就是第二次重复中两个玩家的选择。显然,这个第二阶段仍然是两个囚徒之间的囚徒困境博弈。此时,前一阶段的结果已经成为既成事实,不会有后续阶段,所以实现两个玩家的最大利益是现阶段决策中的唯一原则。
所以我们不难得出一个结论,不管前面博弈的结果是什么,第二阶段的唯一结果都是原博弈的唯一纳什均衡(弗兰克,弗兰克),双方都受益(-5,-5)。
现在我们回到第一阶段,也就是第一局。理性玩家在第一阶段非常清楚后一阶段的结果,知道第二阶段的结果必然是(弗兰克,弗兰克),所以不管第一阶段的结果是什么,双方在整个重复博弈中的最终收益都会是在第一阶段的基础上的-5。所以从第一阶段的选择来看,这个重复博弈是图l中利益矩阵表示的一次性博弈。








