后飞的笨鸟

讲文明,讲礼貌,爱艺术,谈幽默
(个人版权未经许可请勿转载复制)
个人资料
越吃越蒙山人 (热门博主)
  • 博客访问:
正文

囚徒们的困惑

(2018-11-29 10:24:25) 下一个

(博弈论漫谈之二)

 

人,活在世上这一辈子,不知道要经历多少挑战作出多少选择,而且每一次选择都可能对其以后的人生轨迹有着难以尽述的影响。虽然说我们人人都有自私的基因,想把自己的利益最大化,但没有人能有足够好的运气,能够保证每一次选择都是最为利己的。很多时候,利益最大化选项的背后隐含着的也是风险最大。所以,追求极致,未必对所有人都是一个理所当然的选择。好在我们人类的生物思维体系中,有一个能自我修饰自我调整的回路,这就使得我们能够在上一次的选择之后,观察外界的反馈,从而获得经验获得教训获得奖励,并以此作为下一次抉择的依据。

 

上世纪五十年代有两位美国数学家设计了一个游戏,以期通过参与者相互之间的互动,来考察人际间交往信任合作的关系。这个游戏就叫“囚徒的困惑”。它的设计思路是这个样子的:假如你和你的一个朋友被警察指控犯了重罪(当然,你们可能是真干了点什么,也可能是被诬陷的,实际什么都没干),你们被捉进了监狱。在你们还没来得及相互询问沟通一下情况,警察就把你们隔离开来开始单独审讯了。

 

警察刚一开始要做的,肯定是依照惯例,向你交代明白了党的坦白从宽抗拒从严的伟大政策, 而且厉声告诉你,你的朋友在无产阶级专政铁拳的震慑下,早就放弃了抵抗,把所有的一切都招了,他指控你也犯了罪。(这是什么朋友啊。不过现实中肯定是有这样的人的。另外,警察说的可能是真的,也可能是吓唬你的谎话,这事在哪儿都一样)。接下来事态的发展,会根据你们不同的应对产生以下四种可能的结果:

 

A. 如果你不承认被指控的罪行,而且你的同伴也否认了指控,这案子就很难站得住脚,最终的判决会是很轻的,这对你和同伴来说算是双赢的结局,在博弈理论中被称作是合作。当然,在当时的情形下,你根本不可能知道你的同伴会怎么做。

 

B. 如果你坦白承认了罪行,而且你的同伴也坦白承认了罪行,这样,警察没花太大的力气就做实了案子,大功一件。被认定是犯了罪的你们两人肯定是逃脱不掉法律的制裁的。当然,政府也是说话算话的,他们还是会落实坦白从宽的政策,让你们实际得到的惩罚比理应得到的轻了不少。但不管怎么说,对你和你的同伴而言,这还是算作一种双输的结局。

 

C. 但是如果你声称无辜拒绝认罪,而你的同伴却在另一间屋子里全都承认了。那么,这样情形带来的结局对你最为不利,你会得到最为严厉的定罪惩罚,而你的同伴会得到最轻的甚至没有处罚。于是,你会受到双重打击,最为悲催;而你的同伴或说是朋友,却背叛了你,在博弈理论中,那会被称为变节。这是你输他赢的结局。

 

D. 与C类同,如果你是变节的一方,你的朋友是死不松口的一方,他最终会得到最倒霉的结局,是他输你赢。

 

好了,知道了党的政策,和不同情况可能带来的结果后,让我们再把利弊认真梳理一下。首先,如果你和你的朋友(同伙)很默契,合作得天衣无缝,无论是拒绝指控还是承认罪行都能做到步调一致,你们两人就都能避免最坏的可能结局。但是,如果你要是想求稳妥,不追求极端的满意结果,也避免最差的结果,就老老实实认怂,承认罪行是你们干的,这也是条不差的选择;而且,在这种情况下,如果你的同伙负隅顽抗,拒绝认罪,那你会得到意外奖赏,没准最后脱离惩罚也未可知。

 

把这些都想清楚了,你应该能意识到,无论你的同伴怎么做,你的最优选择其实是变节而不是追求与他同进同退口供一致的合作。同样,如果你的同伙不傻,他也会得到相同的推论。也就是说,按照理智的推理,追求双赢结果的风险是最大的,它有可能对你个人的最终结果是最差,造成你输他赢的结局。为了避免这一最糟糕的情况出现,你和同伴最可能作出的决定应该都是变节。所以,如果你们两个人都是冷静理性的,很大的可能,在一开始你们就已经决定要双输了。这就造成了所谓的“囚徒的困惑”。

 

接下来,让我们进一步设想一下。如果这个博弈过程有重复做下去的可能,局中人的行为会发生什么样的变化呢?这样的情形实际是增加了一个反馈机制,它让参与者能够根据自己受到的惩处,来推测同伴上一次的行为,并以此来反思以前的决定及调整下一步的选择策略。于是,一方参与者的行为对另一方来说就是一个返喂伺服信号,你的变节可以造成对方下一次的变节,你一次自我牺牲,可能就会给以后的长期合作埋下伏笔。其实这也是一个隐藏着的自然规律。

 

三十年前,密执根大学的社会心理学教授Robert Axelrod,使用计算机把这个博弈游戏在加多了人加多了回合的情形下推演了下去,他发现,赢得最终胜算的策略好像很简单,无论你被别人利用了多少,被占了多少便宜,你都应该寻求合作,而不是变节,也就是按照我们上一篇讲到的金色定律来出牌:你想别人怎么待你,你就怎么待人。高尚赢得胜利,很好。

 

但是,当这些参与者之中混进了像是曹操那样的人物的时候,不管别人怎么行善,他都按自己能得到最大利益的可能性来出牌,金色定律策略就失效了,因为曹操做出来坏事后,要是得不到负面的反馈,他就会永远这么做下去,一颗老鼠屎就会坏了一锅粥。

 

所以,为了让群体系统的长期共赢局面演变出来,必须引入另一个处事原则——铜色定律和环环相报原则。

 

[ 打印 ]
阅读 ()评论 (12)
评论
越吃越蒙山人 回复 悄悄话 回复 'Luumia' 的评论 : 米娅说的问题有意思,一两句话说不清楚。今天有点忙,我在下一篇或单独写一篇和你探讨一下这个问题。
越吃越蒙山人 回复 悄悄话 回复 '莲盆籽' 的评论 : 莲盆籽脑子这么好还会被绕晕?玩笑了。这个dilemma有点饶人,主要是我功力不够,不能在短篇副里把细节要求说清楚,可我又懒,不想把文章写得太长,只好难为读者了。
另外,上一篇你没困惑,也不简单,说明能看得懂三国了,中文功底一直在恢复见涨,佩服。
Luumia 回复 悄悄话 从某种意义上可不可以说人类就是利益(经济,名誉,情感)的囚徒?金色定律是人类后天摸索出来的利益最优化之道?那么,人性之初又是什么样的?性本善,性本恶,如果没有利益,就无存在之根本?很想知道早期的智人有没有善与恶之分。
莲盆籽 回复 悄悄话 前面那篇不迷惑,这篇给绕晕了。看来我不够善良,也不适合做囚徒。:)
期待下一篇的铜色定律.
越吃越蒙山人 回复 悄悄话 回复 '铃兰听风' 的评论 : 哈哈哈,铃兰蛮自信的。以金色定律挂帅的人,是和善乐观的,肯定和别人更容易合得来也容易获得别人的信任。也谢谢你对我的认可和信任。
不过我对这个电脑模拟游戏可能介绍的不够详细,参加的每个角色都会力求自己得分最高的,所以还是会有猜疑和对别人的打压心理的,要不然游戏设计得太简单,就不容易得到有用的结论了:))
铃兰听风 回复 悄悄话 既然是 teamwork, 我觉得关健在于:
1) 合作伙伴是否同一类人 (自私程度, IQ, EQ, 心理状态, 心脏强大程度 etc)
2) 他们之间的关系亲密程度,
3) 他们彼此互相了解的默契度

这些主要元素决定了他们合作的最终结果.

队友默契度愈高, 双赢的可能性大些; 反之, 队友之间的差异愈大, 有人很自私, 有人没那么自私, 必有人输得很惨.

例如, 你和我组成一队, 双赢的可能性很大 : ))

我尊崇金色定律: 你想别人怎么待你, 你就怎么待人.
越吃越蒙山人 回复 悄悄话 回复 '风水纵横' 的评论 : 哈哈哈,风水是属于坚贞不屈形的。
风水纵横 回复 悄悄话 自我评估:我觉得我是不会变节的一位:)
越吃越蒙山人 回复 悄悄话 回复 '.川晔' 的评论 : 欢迎前来交流指正。
.川晔 回复 悄悄话 刚刚发现山人的博客里有好多好看的文章。Bookmarked!
越吃越蒙山人 回复 悄悄话 回复 '北美先生' 的评论 : 欢迎光临,谢谢留言。
北美先生 回复 悄悄话 谢谢分享,文里的意义非凡!
登录后才可评论.