纯策略纳什均衡怎么求_纯策略纳什均衡定义-胜象大百科-提升认知,打开格局

纯策略纳什均衡是指在一个纯策略组合中，如果给定其他策略不变，节点不会单方面改变自己的策略，否则不会使节点访问成本变小。纳什均衡又称非合作博弈均衡，是博弈论的重要术语，以约翰纳什(johnf nash)命名。

在一场博弈的过程中，无论对手的策略如何选择，都会有一方选择某种策略，这种策略称为优势策略。如果双方在两个博弈中的策略组合构成了各自的优势策略，那么这个组合就定义为纳什均衡。

如果重复博弈存在唯一的纯策略纳什均衡，如何求其纯策略纳什均衡？先看下面这个囚徒困境博弈的例子：

我们现在考虑博弈重复两次的重复博弈，可以理解为给囚犯两次坦白的机会，最后的收益是两阶段博弈中各自收益的总和。在两场比赛的过程中，双方都知道第一场比赛的结果，然后进行第二场比赛。用逆向归纳法分析，先分析第二阶段，也就是第二次重复中两个玩家的选择。显然，这个第二阶段仍然是两个囚徒之间的囚徒困境博弈。此时，前一阶段的结果已经成为既成事实，不会有后续阶段，所以实现两个玩家的最大利益是现阶段决策中的唯一原则。

所以我们不难得出一个结论，不管前面博弈的结果是什么，第二阶段的唯一结果都是原博弈的唯一纳什均衡(弗兰克，弗兰克)，双方都受益(-5，-5)。

现在我们回到第一阶段，也就是第一局。理性玩家在第一阶段非常清楚后一阶段的结果，知道第二阶段的结果必然是(弗兰克，弗兰克)，所以不管第一阶段的结果是什么，双方在整个重复博弈中的最终收益都会是在第一阶段的基础上的-5。所以从第一阶段的选择来看，这个重复博弈是图l中利益矩阵表示的一次性博弈。