--“囚徒困境”博弈的启示
榕城老应
5。君子之道
Nowak,Sasaki,Taylor,Fudenberg等人在2004年《自然》期刊上发表一篇论文“Emergence of cooperation and evolutionary stability in finite populations"带来了新的希望。他们认为进化中的个体不需要面对整个无穷的世界,而仅仅是有限的群体,所以ESS的结果并不是TFT不可逾越之壁。其次,用一个0到1之间的参数k来表示竞争的收益对自然选择影响的程度,0代表着毫无影响,1是唯一的影响,就像在ESS中一样。他们证明了TFT可以在全是恶魔AllD有限群体的地狱中进化产生,合作这时就在自然中涌现。
论文证明了当这群体只有两个个体时,AllD与TFT直接对决,TFT不占优势。但个体数大于三,有一定的概率变异产生的TFT能够入侵AllD群体。当群体中个体数大到几百时,入侵速度也随之变大。当自然选择压力k较大,随着群体进一步加大到几千,入侵速度则随之回落直至入侵被消灭而阻止了。
这个结果十分有意思。它告诉我们:礼尚往来的TFT与只想占便宜的AllD两个相处不占上风。随着群体人数增加,即使原来大家全是斗鸡似的不合作,礼尚往来的风气终将会占了上风,大家都走向合作。在竞争压力不是那么大的小镇乡村,合作容易产生。在竞争压力大的大城市里,人际关系趋向冷漠不大合作。对于千人的大公司,如果将业绩作为升职去留唯一考量的标准,人际关系将会空前的紧张,友善合作就会输于冷漠自私。这一点非常符合人们的经验。
小地方人们抬头不见低头见。人数不是太少,你不和我合作有人和我合作。你占了合作人的便宜,大家很快又会遇上,就没那么客气了。所以这种情况有利于合作是可以想象的。有没有比较具体的数字结果?有。例如,R=3,T=5,P=1,S=0时,在三个人的情况,如果大家都有十次以上交往,合作就易于占上风。四个人,六次以上。很多人,三次以上就足以让礼尚往来TFT蔚然成风。
好了,让我们总结一下讫今为止研究的结果。自然选择的压力决定了采用什么策略的个体能够在囚徒困境的环境下生存。当个体没有记忆能力时,善良的AllC群体必然被无情的恶魔AllD入侵所淘汰,留下一个绝不合作个个互斗的冷漠世界。当个体拥有一点记忆能够记住对手的表现时,只要环境不是特别恶劣,友好又具有报复能力的个体在竞争中因为相互合作又能对抗AllD而赢出。它能入侵AllD的群体,让合作的现象涌现。它能保护AllC与之共荣,从而使得单纯的善良也有了生存的空间。
×-×-×-×-×
我的朋友说:“你所说的纯粹是从利益考虑,TFT不外乎威胁利诱,但那是小人之道。君子喻于义,不肖为之!” 要怎么喻于义呢?孔子在《论语·宪问》里说:“君子道者三,我无能焉,仁者不忧,知者不惑,勇者不惧。” 这纯粹是人品上的修炼了。追求的目标是和利益考量有着不同。这个人品上的追求能带来利益吗?
“仁者不忧”,练到内心无比仁厚,不在乎你占我点便宜。“知者不惑”,心里明白懒得随你起舞。“勇者不惧”,牺牲都不怕,你又能对我怎么样?这几乎是AllC了,最好的合作伙伴嘛!自然界生物进化,但凡有那么一点智慧都首先用于识别敌我。对于人来说,行为难测,合同不足为持,唯有品性比较稳定。这好人修炼到一眼就能辨认出来,不怕吃亏,经得住考验,追求的不是利益而是怎么做人。这就可以成为可以信赖的合作伙伴,关键时刻不需要费心防范的真正朋友,永远不用担心背叛的肝胆同志。凡是真心想合作追求双赢的人都会引为同道与之合作。不需要花费代价来猜疑防范,全力争取最大收益的策略就是了。结果双方都收益巨大。尤其是大道盛行,有势者上位者之所钟,朋党舆论之所向,这个君子得到的好处可比小人要大的多了。
既然当君子有这么大的好处,那模仿君子的特征宣称标榜自己也是君子就是一个廉价的策略了。这就产生如何辨识真君子与伪君子的问题,在策略中就要考虑防范伪君子带来的变数。这不仅在人际关系,在生物界中欺骗与防范的博弈考虑也经常可见。在政治斗争,商业竞争,国家冲突等方面,心智成熟的博弈者绝不会轻信这一类易于装扮和廉价反悔的宣言,他们宁愿相信对方实在的利益得失作为自己策略风险的抵押。
×-×-×-×-×
Brembs在1996年OIKOS一篇Mini-Review论文中描述了生态环境的复杂性。一个群体如果有些孤僻苛刻的个体STFT(首先不合作,然后照抄对方行为)存在,那么具有加倍宽容的个体TF2T(连续受背叛两次才还击一次)在这个群体中要胜过严格的TFT。这是因为收益V(TF2T|STST)>V(TFT|STFT)。TF2T和STFT结合就像一个唱红脸一个唱白脸的组合,搞得单纯的TFT无所适从。用这个思路不难证明其他的情况。例如,只有TFT和善良的AllC的群体,看不出它们积分的不同。当有恶魔AllD入侵时,如果AllC较少,AllD被TFT压制打击成不了气候。如果滥好人AllC很多,养虎遗患,AllD得到充分营养增长积分可以胜过TFT,以致侵吞了整个群体。
朋友嗤之以鼻说:“君子不言利。讲的是杀身成仁,舍身取义的追求。与你说的是不同的境界。君子处世只凭良心,不知道算计也不想算计。”
生物在比较简单低级时,所有的行为策略都建立在本能反应上。随着进化复杂更广泛合作的需要发展出“感情”的追求,必要时它可以压制本能的短视反应,以保护家庭,血缘,集体,种族,国家的利益。在更高层次和统计意义上有益于个体。本能和情感的层次上可能的策略都在严酷的生存竞争中经历过筛选,收益累积较少策略的物种和族群在选择的压力下被消灭,留下对于生存有利的包括TFT和它类似的策略。幸全下来的生物按本能和情感反应行事已经是使用在大多数情况下最好的策略。
自从亚当和夏娃吃了智慧果,有了自我意识以后,人们企图掌控自己的命运,用大脑来对自己的行动决策,以便面对更为复杂,更加长远的博弈。经过千百年时间的沉淀那些对生存有利的,特别是对集体有利的策略思想都以格言,传统,道德规范流传下来,形成一个远比现实世界要简单的价值体系。在这价值体系追寻对现实世界问题的答案通常要比近视的势利算计有更大的长期收益,也更容易决断。
人们依照习惯,简单的算计或在这价值体系追寻答案。社会的合作利益形成的文化促使人们认为依习惯行事的人是单纯或愚鲁的,能算计的人是精明和短视的,有原则的人是高尚和固执的。尽管这不过是跟据不同的方法选择了他们的策略。
人品的追求和社会的道义是不是可以代替博弈的思考,成为促进合作有益于集体和个人的最佳策略依据?
在良性环境对大部分情况,是。毕竟这价值体系在进化中赢出。对一些情况,不是。毕竟他们是两个不同的目标。
“以德报怨”行得通吗?这样额外的宽容,不外乎想争取比较顽劣的对手合作,那要看你有没那实力了。在八十年代美国政治科学有一些论文对策略的稳定性讨论研究。依进化博弈论的观点,这只有你在生存竞争的博弈积分胜过对方时,才有这个余力行这王道。中国近代史,现代史在与列强交锋时层出不穷的应对失措就没明白这个道理。弄得该讨回公道时放弃权利。该奋力一战时依此退却。
以德报怨,无论善恶的伙伴或者对手,人人都是真心喜欢的。无数文艺作品都讴歌赞美这美丽的品性。希望这心灵鸡汤能够营养感动着遇见的每一个人。但当这善人的反制力量不足以威慑对手的背叛决策时,他的命运就不在自己的手中了,而在对方善恶之念中。善则幸甚,恶则怨命。
有人把这君子之道夸为“仁者无敌”,那是过了点。连孔老先生都说:“我无能焉”,尤其是在乱世。其实圣人处世并没有那么迂腐。《论语》中一段对答就明白如话,“或曰:‘以德报怨,何如?’子曰:‘何以报德?以直报怨,以德报德’。” 圣经对这种情况是直接了当地说:“以牙还牙,以眼还眼”(《旧约全书·申命记》)。穆罕默德更是一手拿经一手持剑纵横世界。唯有佛陀最慈悲,能够割肉喂鹰,舍身饲虎,那是他不重视这个皮囊。身死国灭后,现在哪座大寺两旁没有几个凶神恶煞的罗汉金刚?前面还挡着一个手拱武器的护法韦陀。现实之中,没有金刚怒目,那得菩萨低眉!
对于杀身成仁的人,心中充满壮烈的激情可以压倒感情的牵制和本能的保护,毅然选择对个人,家庭不利的策略为了追求心中价值体系终极的目标。革命烈士是这样的,雷锋是这样的,哥白尼是这样的。同样,绿色和平也是这样的,恐怖分子也是这样的,人肉炸弹也是这样的。
高尚善良的人愿意牺牲自己帮助别人,可能不会直接伤害任何人。但也许会不分场合地给罪犯更多权益,打压必要的报复,资助盗贼得以生存,用牺牲纵容恶行,采用AllC策略使得AllD得到充分营养增长,让他们有足够的能量继续为祸。
经过自然选择淘汰生存下来的各种处世之道都有其合理之处。虽然有的高尚,有的丑恶,有的笨拙,有的机巧。
合作通常优于对抗,但自然的力量并非总是给予祝福。聪明的人常常嘲笑愚昧,但笨人常有着机智者不可企求的福分。人们从心底都希望正义战胜邪恶,但世上的不公却处处可见。
恶人欺负好人,报复制止恶行,宽容胜过严苛,安定祝福善良,善良滋养恶人。在竞争的世界,没有一个无敌的策略。对于变化的群体,没有最好的,只有更好的策略。这是一个无休无止进化变动的世界。在信息不完全,未来不可知的情况,博弈理论不能告诉你,出自本能,情感,习惯,经验,理智,道义哪一种的决策是更好的,但可以让你成为局中的一个明白人。
(全文完)