纳什均衡(NE)
策略组合是一个集合,该集合包括每个参与人的一个已选策略,用S1*,S2*,...,Sm*表示(假设这个博弈一共有m个参与者组成),纳什均衡是满足如下条件的均衡:
对于任意此集合内的参与者i,他所选的策略Si*是其他参与者所选策略S-i*的最佳对策(Best Response),也就是说每个参与者都选择了最佳对策。
案例
l | c | r | |
U | 0,4 | 4,0 | 5,3 |
M | 4,0 | 0,4 | 5,3 |
D | 3,5 | 3,5 | 6,6 |
这里我们用蓝色表示参与者1的最佳策略,红色表示参与者2的最佳策略。
可以看出:
BR1(l) = M
BR1(c) = U
BR1(r) = D
BR2(U) = l
BR2(M) = c
BR2(D) = r
(D,r)是纳什均衡。
将纳什均衡和优势劣势联系起来
这里我们又重新回到囚徒困境的情况来分析。同样用蓝色表示参与者1的最佳策略,红色表示参与者2的最佳策略。
α | β | |
α | 0,0 | 3,-1 |
β | -1,3 | 0,0 |
可以看出:(α,α)是纳什均衡。 -- 因为在任何情况下我们都不回去考虑那些绝对劣势策略(如这里的β)。
然而,弱劣势情况就不像绝对劣势情况那样好处理。
案例二
α | β | |
α | 1,1 | 0,0 |
β | 1,1 | 0,0 |
这种情况系产生了两个纳什均衡,即(α,α)和(β,β)。
虽然看上去选(β,β)的情况很傻,但是也是有其一定依据。
游戏:全班同学进行一个游戏,每位同学可以选择投资10美元或者期权,如果全班有90%以上的人都选择了投资,那么投资的人会得到50%的利润;不然,投资的人会损失掉投资的钱。
这种情况下有两种纳什均衡: 全班都投 或者 全班都不投。显然“全班都投”能带来利润而“全班都不投”不能带来利润。 如果初始全班有93%的人投资了,那么在下一次投资的时候会有更多的人投资,趋向于“全班都投”的纳什均衡。 如果初始全班只有不到50%的人投资了,那么下一次骰子的时候会有更少的人投资,趋向于“全班都不投”的纳什均衡。此时较优的纳什均衡处于帕雷托劣势。 那么这个时候如果有一个人站出来跟大家讲道理,说服大家往投资的方向上走,大家还是很有可能趋向于“全班都投”的。 所以纳什均衡和囚徒困境不同的一点在于: 纳什均衡是可以通过说服来改变参与者的选择的。 而囚徒困境是不能通过说服改变参与者的选择的。因为没有一个人会傻到选择绝对劣势策略。
这种情况在上个世纪30年代经常发生在银行挤兑上,坏风气还导致市场泡沫。电影《美丽人生》中就发生过类似银行挤兑的事,但是那家银行没有倒闭,因为Jimmy Stewart站出来指挥大家,只取出生活必须的一小部分钱;最后银行挤兑时间过去之后,大家发现银行没有倒闭,于是又把钱存了进去。人群有一种跟风的想象,就是好的情况出现的时候大家的态度都会趋向于好的情况,坏的情况出现的时候大家的态度都会趋向于坏的情况。
个人总结:
- 纳什均衡“不后悔”no regret,即你做出选择之后不会后悔
- 纳什均衡可能取决于初始条件与阈值(即超过阈值往好的方向发展,低于阈值往差的方向发展 -- 不稳平衡)
- 纳什均衡本身具有强制力,我们最终会做出正确的选择,而不是别人逼迫我们的(区别于囚徒困境,想要化解囚徒困境必须签署合同)
纳什均衡收风气影响的例子: 微软的垄断导致大量软件与微软绑定 。。。。。。
时间: 2024-10-16 09:55:25