如果说“零和游戏”是博弈论中的一个最重要的特例,那么“囚徒困境”无疑就是最具普遍性和代表性的博弈论模型。甚至可以说,不谈“囚徒困境”我们就无法谈论博弈论。
“囚徒困境”的故事大致是这样的:
甲、乙两个人一起携枪准备作案,被警察发现抓了起来。因为没有其他犯罪证据,警方只能以非法携带枪支的轻罪处罚他们。但是警方怀疑这两个人可能还犯有其他重罪,于是分别进行审讯。警方告诉他们:如果主动坦白,就有可能得到宽大处理。否则,一旦同伙主动交代,抗拒者则必将受到重罚,而坦白者可以立功减刑。
在这种情形下,这两个囚犯必须作出自己的选择:或者他们相互背叛,与警方合作;或者保持沉默,和自己的同伙合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):
1、如果两人都不坦白,警方会以非法携带枪支罪各判两人1年徒刑;
2、如果其中一人招供,而另一人不招,坦白者作为证人将被免予起诉,另一人将会被重判10年;
3、如果两人都招供,则两人都会因抢劫罪各判5年。
我们假设这是两个聪明的囚犯,现在这两个聪明的囚犯该怎么办呢?是选择相互合作还是相互背叛?从表面上看,他们应该相互合作,保持沉默,因为这样他们俩将得到对双方来说都是最好的结果——只获刑1年。但是,由于信息被封闭,两人无法交流,而他们又不得不考虑对方可能采取的选择。由于甲、乙两个人都十分精明,所以他们都会优先考虑如何才能减少自己的刑期,至于同伙被判多少年已经顾不得许多了。
甲会这样推理:
假如乙不招,我只要一招供,马上就可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢10年,他却获得了自由,而我招了也只坐5年,显然还是招认为好。可见无论乙招与不招,我的最佳选择都是招认。所以还是招了吧。
也就是说在这种情况下,如果甲认为乙会合作,则甲背叛能得到更多的利益;如果甲认为乙也将背叛,则甲的背叛也能得到更多的好处。所以无论乙采取什么样的行动,选择背叛对甲来说结果总是好的。
于是,甲似乎知道该怎样做了。但是,相同的逻辑对另一个人也是同样适用的。因此,乙也会选择背叛,而不管甲如何做。
这样一来,甲、乙两人都选择招供,这对他们个人来说都是最佳的决定,即最符合他们个体理性的选择。
按照博弈论的说法,这是他们双方的“优势策略”,也是他们所能选择的唯一平衡点。在这一点上,任何人单方面改变选择,他只会得到较差的结果。
现在问题出现了:按照他们的最佳选择,他们将是双方背叛,只能一起去坐5年牢,这比他们双方合作,只坐1年牢的结果显然要差很多。由此我们注意到个体理性导往往导致双方得到的实际利益比可能得到的要少得多,这就是著名的“囚徒困境”。