小思

每天都发现一个新的自己
个人资料
小思维 (热门博主)
  • 博客访问:
正文

纳什聪明一月顶我们苦干一生

(2015-05-29 00:17:03) 下一个
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了跨世纪的贡献,是继冯·诺依曼之后最伟大的博弈论大师(之一)。他提出的“纳什均衡”理论在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。比如它可以用于目前伊朗与其他大国之间核武器谈判;也可用于多个公司争夺业务的产品市场;它还可用于指导政治活动,比如候选人试图利用博弈论制定策略以击败对手。"策略性"这个词很重要,因为从各种可能的方案中选择,要充分考虑到其他人的行动或可能的行动方式,而且遵循"基本规则"的前提下,有目的行动和寻求自身的最大优势。

纳什对博弈论的贡献是艰深的数学解释,并且被冯·诺依曼认为有点琐碎。它的产生离不开1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》。冯·诺依曼提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。对博弈问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)研究的简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思报道了两个寡头的产量与价格垄断;中国2000多年前孙膑利用博弈论方法帮助田忌赛马取胜属于早期博弈论的萌芽。带有很大的偶然性,很不系统。

诺依曼的博弈论过于抽象,其应用范围受到很大限制。正是在这个时候,非合作博弈——“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!

纳什不是一个按部就班的学生,他经常旷课,但他是一位天才的非凡人物,他广泛涉猎数学王国的每一个分支,如痴如狂的学习拓扑学、代数几何学、逻辑学、博弈论等。纳什非常的自信,充满咄咄逼人的学术野心。1950年夏天忙于应付紧张的考试,他的博弈论研究遗憾地中断。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!

这一年的10月,他骤感才思泉涌,妙笔生花。产生了一个最耀眼的亮点-日后被称之为“纳什均衡”的非合作博弈理论。写出题为“非合作博弈”的长篇博士论文于1950年11月刊登在美国全国科学院每月公报上。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇27页的博士论文)。应该感谢师兄戴维·盖尔鼓励和督促,纳什曾遭到冯·诺依曼贬低几天之后,告诉盖尔已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他已经意识到纳什的思路比冯·诺伊曼的合作博弈的理论更有适用性,对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,不知道竞争的险恶。盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨更是大力推荐给科学院。纳什一生的文章不多,但都是精品中的精品。

要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。

博弈论确切地说是运筹学的一个分支。这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。从我们的日常生活中的凡人小事入手,娓娓道来。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。

但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。

“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。

从“纳什均衡”有普遍意义。“囚徒的两难处境”适用于价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

纯数学家们对“纳什均衡”不以为然,而对他在代数几何中的工作印象更加深刻。随着时间推移,他开创的游戏理论方法早已广泛应用于社会科学,特别是在经济学中。博弈论发明之前,经济学家讨论了买家和卖家,如粮食和其他大宗商品市场基于账户动力学的竞争性市场。即是供应和需求的关系,遵循阿尔弗雷德 · 马歇尔(和其他产生于发达国家)的理论。经济学家采用整体经济的运作理论: 凯恩斯主义经济学。但这些理论面对多家公司竞争的复杂情况无可奈何,比如企业监管方式,或拍卖中价格决定办法。

冯 · 诺依曼和摩根斯坦为分析这种复杂情况提出了博弈论理论框架。成功地揭示"平衡"的存在,尽管在相对狭窄范围内的相互作用。所谓零和游戏,一个人的收获和另一个人的损失(两人打扑克是零和全的游戏,抛硬币的正和反)。在大量竞争对手之间的市场,冯 · 诺依曼理论不能回答:怎样才能积极地获取经济盈余?

这是纳什的切入点。他通过球赛(游戏)先定义一个特定的解决方案 — — 一个标记每个球员制定最好的战略,但同时必须考虑到其他球员用到了什么方案。其实纳什采用了荷兰数学家 L.E.J.布鲁尔早年提出的一个深奥的数学理论,布鲁尔的"不动的点定理"。纳什平衡可以根据球员数目和选择方式的数目,计算任何最佳的方式。

尽管表面看来,纳什贡献的原创性并不高。应用布鲁尔理论,解决了冯 · 诺依曼没有超越的问题。纳什贡献的重要性在于"纳什均衡"的想法,亦被称为最优反应平衡。经过长期考验,纳什均衡成为经济学教科书阐述供给和需求曲线的经典理论。

我感叹呀,1950年10-11月宝贵的一个月,纳什写出"纳什均衡",完成了他一生的全部任务。接下来就是发疯似的生病,然后静候诺贝尔奖。启示:我等凡人也不妨疯狂工作一个月,找到自己的灵感,并写出一个啥样的理论,然后享用一辈子。

 
[ 打印 ]
阅读 ()评论 (0)
评论
目前还没有任何评论
登录后才可评论.