12版 书评  查看版面PDF

2017年

1月11日

查看其他日期

当一个科学全才
成了理性狂人的时候——读《囚徒的困境》

2017-01-11 来源:上海证券报 作者:⊙胡艳丽

当一个科学全才

成了理性狂人的时候

——读《囚徒的困境》

⊙胡艳丽

合作与背叛,是人类社会永恒的命题。各类群体的相聚,自然会产生有关合作与背叛的“囚徒困境”。世界知名畅销书作家威廉· 庞德斯通在《囚徒的困境》中,围绕数学狂人冯·诺依曼(John von Neumann,1903-1957)的生平及博弈论发展史这两条主线,讲述了一段鲜为人知,却有可能给人类社会造成沉重创伤的学术及历史旧事。

博弈论有诸种不同的光彩,将之置于书房中,它是如朱砂玉器一般可供反复欣赏、把玩的艺术品;将之放于生物、心理、社会、经济、法律等领域,它便是一项可供权衡利弊,借以参考决策的工具;但若将之与原子弹绑在一起,便立即成了行恶者的通行证。20世纪在现代计算机、博弈论、核武器和生化武器等诸多领域内有杰出建树的科学全才冯·诺依曼,则展现出比博弈论本身还复杂的光芒:在数学领域,他大脑的运算速度甚至超越了当时的计算机;在计算机世界,他是各种疑难杂症的终极解决者;在婚姻生活中,他是情商低下的弱者;而当他将博弈论与原子弹相结合,则表现出冷血无情的一面。他一生亦正亦邪,兼具大智若愚与大愚若智的两面性。

博弈论虽然是致力于解决人们在两难或多难困境中的选择难题,其核心却是利益的多维计算,说得更坦白一点,就是将各种选项所能导致的结果量化为数字,然后展开比大比小的游戏。在冯·诺伊曼的术语中,“博弈”就是一种冲突的态势,他从数学上证明了,即使在充满非理性的世界中,在两个人的博弈中,只要他们的利益完全相悖,就总是存在一个理性的行动过程,这被称为“极小极大定理”。诺伊曼就是利用“极小极大”定理在各种各样的博弈中寻找最优答案的那个“理性”狂人。

从利益的考量到情感与生命的抉择

囚徒困境,是自博弈论问世以来影响最大的一种博弈过程。其魅力在于它总是将人置于两难的境况之中,且不断为其赋予新的意义,承载越来越多超出数学计算和人与人之间的算计之外的东西,甚至可以因多人博弈及现实环境的复杂性而呈现人类社会深层的矛盾,指引人们看清复杂困境的本质,进而寻求优化解决方案。

囚徒困境的原始版本是:两个曾并肩作战的伙伴,同时被关进不同的监狱,假如他们都不背叛对方,选择沉默,因证据不足两人各坐牢一年;若一人背叛,而另一人沉默,则背叛者因立功而获释,沉默者因不合作而获刑五年;若互相背叛揭发,则因证据确凿,两者都判刑两年。在此案例中,因双方无法在事前获知对方的选择,为保证不因对方的背叛而独自承担最坏结果,“理性”的人会选择背叛,而信守承诺者则有可能遭受最大损失。

在此种情形下,道德上最易招致谴责的背叛行为,反而在“理性”世界中成了背叛者的通行证。此困境也可拓展为多人博弈,这是揭示在合作有利于集体利益情况下,为何个人会背弃集体利益追求私利的有力说明。但需注意的是,背叛只是一次性“囚徒困境”中的制胜法宝,而双方博弈的次数若延至N次,博弈的利益法则则会发生变化,人们会倾向于从彼此持续的合作中收获好处,任何一方的背叛,其成本都是高昂的,在后续的博弈中,会收获源源不断的惩罚。

再来看囚徒困境的升级版本:你和你深爱着的人分别被关在两个房间中,两人身边各有一个按钮,并且你们都知道,除非两人中有一人在规定的60分钟内按下按钮,否则两个人都要被处死;而先按按钮的人可保住对方的性命,但自己将立刻被处死。你该怎么办?

这是一个关于爱与生命的考题,不经历真正的生死考验,没人知道自己在关键时刻能做出怎样的选择,但不可否认,等待对方按下按钮解救自己,对个人而言利益最大化。之所以说这是囚徒困境的升级版本,是因为在这个版本中,人在爱与生命价值之间痛苦地权衡取舍,此时人不再是一台只懂得利益计算的机器,而是有血有肉有情感的真正的人。

数学狂人、博弈论

与原子弹相遇的化学反应

假若上面两个案例,只是用以揭示人们在复杂的经济、社会棋局中做出种种选择的原因,那么下面这个涉及国家安危,甚至全人类共同命运的现实版本,则令人不寒而栗。

1949年8月,苏联在西伯利亚爆炸了它的第一颗原子弹,成为继美国之后又一个拥有核武器的国度,由此也引发了全球范围内各国之间的核武器军备竞赛。危机摆在世人的面前,在战争一触即发之际,抢先按动核按钮,毁灭敌人保全自己的诱惑,对任何一个国家而言几乎都是不可抗拒的。20世纪50年代,在美国和西欧很多人主张美国发动一场对苏联“先发制人的战争”,这场战争甚至不需要理由,与其说是政治、军事争端,不如说是一场赤裸裸的“国际一哥”地位之争。

在鼓吹“先发制人战争”过程中,两位大数学家吸引了世人的眼球,其一是伯特兰·罗素、另一位便是冯·诺依曼。《生活》杂志曾引用诺依曼的言论:“如果你问为什么明天不用原子弹去轰炸他们,我倒要问为什么不今天去轰炸呢?如果你说今天5点去轰炸,那么我要问为什么不是今天1点就去轰炸呢?”

无疑,假如从个体(国家)的利益考良,与其信任对方国家能够始终保持克制,不如率先使用核武器,不如自己掌握主动权,率先发动攻击,以保证自己不会因对方的核弹突袭而化为一片废墟。但这其中忽略了一个巨大的问题,那就是在核武器之下,倒下的不仅仅是建筑、树木,被炸飞的不仅仅是车辆、公共设施,还有数以百万计的人,人的生命将在瞬间灰飞烟灭。当然,还有山河的泣血悲吟,以及在相当长的时期内都难以恢复的生态环境。

冯·诺依曼这位精通数学,善于把复杂的事物缩略成最简单的加减乘除运算法则的天才,如若真正掌握了政治力量,今天这个地球也许已经形似骷髅。万幸,掌握人类生死按钮的精英们迄今还没有被这种由疯狂的数学家倡导的“纯粹理性”所左右。

冯·诺伊曼在数学世界里聪明绝顶,他拥有摧枯拉朽般的魔力,一生都应远离尘世事务,在工作室里玩转神秘的数理逻辑。悲哀的是,他偏偏想要在政治、军事、社会领域大显身手。然而,数学是把世间的一切化繁为简的学问,要把干枯的公式、定律,放回到现实千变万化的环境中,则要把那些被压缩、替除的选项一一还原,被天才的思维抽空了情感的诺伊曼显然不具备这样的能力。他看似强大的“理性”,在一时一地,一段时期之内或许能表现出正确性,但若放在人类长远生存发展的视野来考虑,则活脱脱就是个头脑简单、意气用事,处于叛逆期的大男孩。就如同书中介绍的“胆小鬼游戏”中蒙上眼睛的比赛者,以及“志愿者游戏”中的那些贪婪者,他即使在“囚徒困境”中暂时为己方赢得一次胜利,同时也在为失败埋下了深深的伏笔。

让阳光照进“囚室”

既然有囚徒困境的广泛存在,为何人类社会还会有广泛的合作?原因并不在于道德,而是时间在此中起到的神秘作用。在一次性博弈中,背信弃义者总会得到好处,但在长期与广阔的社会生活中,信守承诺者会收获良好名声,进而产生一系列附加收益。即使在蒙昧未开的丛林时代,人们依然尝到了合作的好处,进而形成了稳定有序的合作关系。以感性为名的真正的理性,仍在人类繁衍的长河中起到了至关重要的作用。

哈佛大学数学与生物学教授马丁·诺瓦克曾在《超级合作者》中深度剖析人类社会行为的奥秘,指出背叛是合作的衍生剂,合作是推动自然社会和人类社会不断进步发育的原动力。正如囚徒困境所揭示的,一次性偶遇,自利者往往能从背叛中获得最大收益;但在相对闭合的群体中,多次接触会为合作创造条件。为避免一次性交易中所产生的“背叛倾向”,社会习惯于为一个人累积名声,在大数据时代,这种名声的累积超越了时间和地域,成为一项如影随形的社会资产,为破解囚徒困境提供了新的方法论。

需要注意的是,人们在包括互联网在内的任何公众场合表现出较强的“合作”倾向,而在不被阳光照射到的地方,则会不自觉地启动“自利”模式,为私利而损害公共利益。因此,在广泛的社会生活乃至国际舞台上,破解囚徒困境的最佳方式,并不是一系列计算与测量方法,而是建立一种有效的监督制衡机制,让阳光照进“囚室”。而能令核武器拥有国永远不去触动那个核开关的制衡之道,则在于一种由全球力量共同形成的国际公约。