博弈论之囚徒困境

苦逼的码农

共 1348字,需浏览 3分钟

 · 2020-03-06


来源:小浩算法

作者:程序员浩哥

fd9af3aa896458ac6aac863d14cc474d.webp

本系列将为大家带来一整套的博弈论问题。因为在面试的过程中,除了常规的算法题目,我们经常也会被问到一些趣味题型来考察思维,而这类问题中,很多都有博弈论的影子存在。这些公司里以FLAGFacebook, LinkedIn, Amazon, Google)为典型,特别喜欢考察本类题型。同时,本系列将不一定都是算法问题,不是IT行业的小伙伴也可以进行学习,来提高分析问题的能力~



117c9ffe60bf40c9bcf60feef5580a18.webp



01什么是“博弈论”

fae1a2d68a68c10ee2c5083e2a95fcb4.webp

古语有云,“笑人情似纸,世事如棋”。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布子,精明慎重的棋手们相互揣摩、牵制、争赢,下出诸多精彩纷呈、变化多端的棋局。而什么是博弈论?就是研究棋手们 的“出棋” 过程,从中抽象出可逻辑化的部分,并将其系统化的一门科学,也是运筹学的一个重要学科。


我们从最简单的一道“囚徒困境”来进行学习~


02囚徒困境

6dea04a7032df04b6bf38d0aed58106b.webp囚徒困境:一件严重的纵火案发生后,警察在现场抓到两个犯罪嫌疑人。事实上,正是他们一起放火烧了这座仓库。但是,警方没有掌握足够的证据,只得把他们分开囚禁起来,要求他们坦白交代。

在分开囚禁后,警察对其分别告知:


如果你坦白,而对方不坦白,则将你释放,判对方8年。

如果你不坦白,而对方坦白,则将对方释放,而判你8年。

如果你两都坦白了,则判你两各自4年。


那么两个囚犯应该如何做,是互相背叛还是一起合作?


从表面上看,其实囚犯最应该的就是一起合作,都不坦白,这样因为证据不足,会将两人都进行释放。但是!因为事实确实是两人放的火,所以他们不得不进行思考,另一人采取了什么样的行为


犯人甲当然不傻,他根本无法相信同伙不会向警方提供任何信息!因为如果同伙一旦坦白,而自己这边如果什么都没说的话,就可以潇洒而去。但他同时也意识到,他的同伙也不傻,也会同样来这样设想他。


所以犯人甲的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方!这样的话,如果他的同伙笨得只会保持沉默,那么他就会是那个离开的人。而如果他的同伙也根据这个逻辑向警方交代了,那么也没有关系,起码他不必服最重的刑!


2a7930e2cadd55b655901398a3eadd9a.webp


03囚徒困境与纳什均衡

fae1a2d68a68c10ee2c5083e2a95fcb4.webp

这场博弈的过程,显然不是顾及团体利益的最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都可以无罪释放,总体利益更高!但根据假设(人性),二人均为理性的个人,且只追求自己的个人利益。均衡状况会是两个囚徒都选择背叛,这就是“困境”所在!


事实上,这种两人都选择坦白的策略以及因此被判4年的结局被称作“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。


我们看一下官方释意是多么难懂“所谓纳什均衡,指的是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。”简单点讲,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。


推荐阅读

全部文章分类与整理(算法+数据结构+计算机基础),持续更新

【吐血整理】那些让你起飞的计算机基础知识:学什么,怎么学?

普普通通,我的三年大学

写公众号15个月以来,这一路上的学习与收获

历经两个月,我的秋招之路结束了!

2020 第一篇原创 | 我是如何让自己变的更加优秀的?

浏览 12
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报