经典博弈案例 "囚徒困境” 分析

博弈论又称对策论,是研究两人或多人之间竞争合作关系的一门科学。目前被大众熟知的例子有:田忌赛马等等。

而所谓的"囚徒困境"也是这样的一个经典例子,大意是这样的:

两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。

在这种情景下,两个囚犯都可以做出自己的选择:供出他的同伴,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。(用双变量矩阵来描述更易于理解)

如果两人都抵赖,各判一年,显然这个结果更好一些。囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在对方的表现不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。

如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益,这也就是经典经济学中的"理性人假设"。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够相信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。现设想困境中两名理性囚徒会如何作出选择:

若对方沉默时,背叛会让我获释,所以会选择背叛。

若对方背叛、指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论--选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性客观的个人,并且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。而且纳什均衡是较常发生的。

原文地址:https://www.cnblogs.com/IQ130/p/10088764.html

时间: 2024-10-08 16:18:48

经典博弈案例 "囚徒困境” 分析的相关文章

携程制造的“囚徒困境”:航司们何去何从?

从鲸吞去哪儿约9成份额到如今持续砸30亿意图染指航司,这一连串的动作对携程来说,虽然更像是属于对去哪儿坑害消费者遭航司集体下架后的突围之招,但真实境况恐怕并没有圈内看客们所看到的那么简单. 在股权置换上,携程和去哪儿的股权置换被多人解读为垄断市场,依法应必须进行反垄断申报,而事实上携程背后的外资菁英们和所谓的华尔街"大师"团队却通过精心布局逃避法律管控,比如使用公关方式四处出击封人口实和遮人耳目等,以期瞒天过海.因为不依法进行反垄断申报可以规避一定责任,但一旦走法律程序,客观上就存在不

Javascript+CSS经典效果案例剖解

在编写前端代码的时候经常会因为网页添加什么动态效果而发愁,现在给你一些经典的案例,可以到时候参考一下的. CSS+js滚动图片功能: 涉及到的知识点:CSS: width height background-image以及其他一些样式属性, Javascript:Event事件有:mouseover mouseout click image的load DOM:element.style element.scrollTop 以及 setInterval() clearInterval()等 需要定

HDU 2897 邂逅明下 (经典博弈变形)

邂逅明下 Problem Description 当日遇到月,于是有了明.当我遇到了你,便成了侣. 那天,日月相会,我见到了你.而且,大地失去了光辉,你我是否成侣?这注定是个凄美的故事.(以上是废话) 小t和所有世俗的人们一样,期待那百年难遇的日食.驻足街头看天,看日月渐渐走近,小t的脖子那个酸呀(他坚持这个姿势已经有半个多小时啦).他低下仰起的头,环顾四周.忽然发现身边竟站着位漂亮的mm.天渐渐暗下,这mm在这街头竟然如此耀眼,她是天使吗?站着小t身边的天使. 小t对mm惊呼:"缘分呐~~&q

PE经典DIY案例1:全解开方案让量产PE也能

更新说明:因未来的uefi似乎并不能识别并引导ud区,但能识别和引导量产和u+B+隐藏或高端隐藏区,故解决量产PE对u+B+隐藏区的支持,并增加对UEFI启动支持,已经成为PE制作的最主流技术. PE的最迷人之处,就是DIY.通过DIY,新人才能慢慢提高水平. 假期研究了一下U+和B+隐藏.穿发奇想,大部分量产版专用PE,并不支持U+和B+隐藏.就想让大家简单改造一下,让手中的量产专用PE,都能来玩U+和B+隐藏.这里指的量产PE,一般都为内核解开的:多引导一般为grub,其它引导请自行研究解决

Oracle经典查询案例

1.创建一个学生管理数据库,名称为student 2.最少包含一下三张表 S (SNO,SNAME)学生关系.SNO 为学号,SNAME 为姓名 C (CNO,CNAME,CTEACHER)  课程关系.CNO 为课程号,CNAME 为课程名,CTEACHER 为任课教师 SC(SNO,CNO,SCGRADE)     选课关系.SCGRADE 为成绩 查询题目 1. 找出没有选修过"张三"老 师讲授课程的所有学生姓名 2. 列出有二门以上(含两门)不及格课程的学生姓名及其平均成绩 3

51nod三大经典博弈(模板)

真是令人惊讶,三大经典博弈都可以通过数学运算得到结论简单解决! Bash游戏(数学余数方法) 关键:必输局面,谁面对(k+1)个石子这个局面必输! 1 #include <iostream> 2 using namespace std; 3 4 int main() 5 { 6 int T; 7 cin>>T; 8 while(T--) 9 { 10 int n,k; 11 cin>>n>>k; 12 13 if(n%(k+1)) cout<<'

java接口回调的经典使用案例

java接口回调的经典使用案例 内容简介: 接口回调的理解及需要关注的问题 接口回调一般常规用法 接口回调简洁用法 接口回调的意义 接口回调简介: 简单的说接口回调就是:调用者A类访问了被调用者B类中的M方法.这个M方法在执行完毕后又调用了A类中的方法. 问题? B类中的M方法是如何访问A类中的方法的呢?弄清了这个问题,也就明白了接口回调. 下面我们根据一个场景描述去编写代码: 我们在调用者Caller类中使用被调用者Collee类中的下载文件方法DownLoadFile().下载完成后要通知C

poj2975 Nim(经典博弈)

Nim Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 5866   Accepted: 2777 Description Nim is a 2-player game featuring several piles of stones. Players alternate turns, and on his/her turn, a player’s move consists of removing one or mor

JAVA并发,经典死锁案例-哲学家就餐

转自:http://blog.csdn.net/tayanxunhua/article/details/38691005 死锁经典案例:哲学家就餐. 这个案例会导致死锁. 通过修改<Java编程思想4>一书中的案例,来做实验,代码更易理解,结果也相对容易控制. 附代码: 筷子类: 1 package com.tyxh.ch21.c6; 2 3 public class Chopstick { 4 private boolean taken = false;//判断是此筷子是否被拿起 5 pub