6版 书评  查看版面PDF

当AI学会游戏,人类还剩什么底牌?——读《七弈万象》

2026-03-16 来源:上海证券报
  《七弈万象》
  (美) 奥利弗·罗德 著
  高 丽 译
  浙江科学技术出版社/湛庐文化
  2025年10月出版

◎南 芃

在AI浪潮席卷各行各业的当下,人类还具有什么优势?当工具比人类更快、更强时,人类还能做什么?《七弈万象》这本书独辟蹊径,从7种经典游戏与人工智能的博弈史中,试图寻找问题的答案。

如果说游戏是人类智力发展的关键,那么,它们同样是AI发展的核心。本书作者奥利弗·罗德是博弈论、AI、经济学的三栖学者,同时也是资深的游戏玩家。书中的7种游戏对应7种人类思维,共同构成了一个基本的智能演化图谱:国际跳棋考验记忆力;国际象棋锤炼领导力;围棋深化理解力;西洋双陆棋需要应变力;德州扑克测试判断力;拼字游戏磨炼平衡力;唯有桥牌体现出复杂系统的决策力,因此它可能是本书所有游戏中最“人性化”的一种,在与AI对弈中,仍保持人类总体优势。

这7种游戏可以视作两类游戏的集合:运气游戏加上竞技游戏。这也恰似现代社会隐含的游戏逻辑:强者恒强,弱者则需要依靠概率去赢。本文将聚焦国际象棋、西洋双陆棋与桥牌这三种最具代表性的对决,展现人类如何从启蒙时代的机械幻梦,一路走向与机器共生的未来。

机器能思考吗?

1770年春天,在哈布斯堡王朝宫廷。皇后玛丽亚·特蕾莎和臣民们全都望向一个橱柜。柜子里坐着一个真人大小的木头人。橱柜顶部放着一个国际象棋棋盘。

这是一台自动象棋机。王室科学家沃尔夫冈·冯·肯佩伦男爵宣布,这台象棋机能够战胜人类。男爵用钥匙给机器上好发条。嗡嗡作响一阵后,机器人转过头,伸出一只戴着手套的左手,抓住一个棋子开始移动。人类对手很快落败。

这台象棋机在接下来几十年里大出风头:在伏尔泰和卢梭经常出没的巴黎国际象棋沙龙摄政咖啡馆,引起人们的围观;1783年,它击败了刚刚签署《巴黎条约》的棋迷本杰明·富兰克林;1809年,它击败了法国皇帝拿破仑·波拿巴。作为一台机器,它不会像官员们一样,让拿破仑获胜。当时最伟大的棋手之一菲利多尔虽然赢了这台机器,但是他认为这台机器是一名可怕的对手。

后世管这台机器叫作土耳其傀儡。它是一个冒牌货,几十年来,很多人类国际象棋大师都曾藏在这台机器的小隔间内操纵博弈。侦探小说鼻祖爱伦·坡对它既着迷,又怀疑。因为国际象棋不具有确定性,比如说,它不像解二次方程那样有固定解法。国际象棋中的每一步走棋都取决于对手的行棋,取决于人类的推理和想法。爱伦·坡认为,国际象棋是人类智慧的独特领域,机器无法涉足。

在一个半世纪后,西班牙发明家创造出第一台真正的国际象棋机。虽然它只会下特定的残局,但无论人类如何防守,它都可以在50步以内取胜。

1950年,有一位象棋爱好者提出了一个问题:机器能否思考?两年后,他为国际象棋程序编写了代码,并用徒手运算开启了人类有史以来第一次与程序进行的国际象棋比赛。在这次比赛中,人类棋手在29步后艰难获胜。他就是被称为“计算机科学之父”和“人工智能先驱”的艾伦·图灵。

几乎是在同一个时间,贝尔实验室的应用数学家克劳德·香农发表了一篇论文,阐明了国际象棋对AI的重要性。他认为,国际象棋的离散结构非常符合现代计算机的数字本质。论文列出了使得国际象棋机器得以运转的基本数学原理。这篇论文的框架被后来的“深蓝”(Deep Blue)和AlphaGo等系统发扬光大。

“深蓝”与AlphaGo把游戏作为“简化现实试验场”。在每一种游戏中,人类的“失败”都是AI拆解复杂问题的迭代。人类专属的博弈智慧在AI面前是可拆解、可量化的数学问题。

让计算机自己理解游戏

玩西洋双陆棋,宛如是上一堂人生课,成功的棋手必须坦然接纳骰子赋予的机会,在发挥最佳水平后继续前行。这是一场运气与技巧微妙平衡的博弈,其分支因子高达国际象棋的十倍,骰子的随机性使得任何长期计划都充满不确定性。

作者认为,在国际跳棋或国际象棋等确定性游戏中,计算机的主要优势在于能深度搜索海量的未来着法,评估和找到位置的速度远远超任何人类玩家。但是,这套方法不适合西洋双陆棋,因为在这里,棋手无法提前很长时间制订计划。每一步都由骰子随机决定,仅一次投掷就能创造出21种可能的组合,而任何一种可能都会引发完全不同的发展态势,迫使玩家必须在不断的变数中作出即时决策。

1986年,西洋双陆棋顶级棋手杰拉德·特索罗在普林斯顿大学获得物理学博士学位。在大学里,他将四分之一的时间花在玩西洋双陆棋上,并敏锐洞察到其作为神经网络应用试验场的潜力。“神经网络非常擅长模式识别,这很像人类玩西洋双陆棋的方式。你可以查看电路板上的配置模式,并根据这些模式知道哪一步更好。”

特索罗的目标很简单:让计算机自己理解游戏。特索罗和自己下了数百局棋,将所有棋谱和所掷的骰子数都记录下来。1988年,特索罗终于创建了一个可以击败自己的程序TD-Gammon,该程序用了30多万局棋完成了自我训练。在击败了当时已有的西洋双陆棋程序后,TD-Gammon挑战了两届世界冠军比尔·罗贝蒂。罗贝蒂在险胜后,留下一句话:“计算机不会害怕,从不做任何愚蠢的事”。

虽然TD-Gammon未以压倒性优势“击败”人类,但已证明机器可以通过自我学习,达到与人类顶级选手对等的竞技水平。特索罗认为,“深蓝”不过是装载海量手工编码、临时拼凑模块的巨型计算器,TD-Gammon却全凭自学成才,优雅且智能。

西洋双陆棋玩法具有广泛的应用前景。在随后的几年里,特索罗的研究涉及定价算法、计算机病毒检测、拍卖系统和数据中心的能源消耗等各个领域。在马萨诸塞大学,这种方法被用来控制电梯运行流量;在美国国家航空航天局,它被用来为航天飞机制订车间作业计划。

尽管TD-Gammon从未对外开放,它却成为现代AI的楔子。擅长识别模式的神经网络,搭配人类无法企及的计算能力,不仅在西洋双陆棋领域独步天下,还在面部识别、自动驾驶等领域大放异彩。这个最初用于探索游戏策略的系统,最终为人类解决了现实世界的具体难题,成为了我们今天所称的AI身后的“智囊”。

人类最后的底牌

尽管AI在游戏领域屡建奇功,却在桥牌面前遭遇了顽强抵御。这片被称为“未受AI浸染的最后疆土”,其核心难点在于叫牌阶段的独特双重属性:它既要像拍卖行竞价般震慑对手,又要在严苛的规则限制下,向搭档合法且隐秘地传递手牌信息。计算机科学家安东尼·沃瑟曼曾指出,定约桥牌的叫牌过程,曾是计算机程序长期以来无法娴熟驾驭的智力高地。

定约桥牌依赖复杂的语言沟通,玩家用“约定叫”这套精密行话来传递信息、缔结联盟,并在叫牌过程中争夺定约。作者认为,它更像一个微缩的复杂现实世界:与国际象棋不同,它充满随机性;与西洋双陆棋不同,它存在隐藏信息;与扑克不同,它强调团队合作。这项游戏不仅考验记忆、智慧、谨慎与冒险精神,更要求玩家具备对盟友和对手的深刻同理心。这些能力几乎涵盖了人类在现实世界中取得成功所需的所有核心能力。难怪沃伦·巴菲特也是著名桥牌爱好者,显然这绝非巧合。

早在1962年,麻省理工学院研究生盖伊·洛兰·卡利就在克劳德·香农的指导下开发了首个桥牌程序。然而,直到20世纪90年代,商业桥牌程序的智能水平仍被评价为“糟糕”。

转折点出现在1996年,科学家马特·金斯伯格描绘了GIB程序的蓝图。当时的技术障碍在于,分析一局牌可能的出牌顺序,计算机需要耗时约1027秒,远超宇宙的年龄。但金斯伯格认为这些困难并非不可克服。事实证明了他的远见,GIB不仅在1998年和1999年连续两届世界计算机桥牌锦标赛中夺魁,其商业版也以79.95美元的价格面世。《桥牌世界》评价它是“我们见过的最好的桥牌程序”,但“行为有时很奇怪”。

GIB之所以受欢迎的一个关键原因是,其开创的“诚信竞争”模式消灭了作弊的可能。在线桥牌中,人类可以过电话等方式传递私人信息,但是机器人搭档消除了这一隐患,双方各与AI组队,在透明规则下竞技。

尽管2022年AI系统NooK曾在固定定约、去除叫牌阶段的特定条件下击败过人类世界冠军,但在包含完整叫牌、心理推理、信号解读与临场判断的全局对弈中,人类仍保有明显优势。桥牌之所以仍被视为人类保持整体优势的最后堡垒,根源在于人类与机器的根本差异:人类通过语言和叙事理解游戏,依赖经验总结理论;计算机则仰仗算力对决策树进行暴力搜索。与很多棋牌类游戏不同,在桥牌领域没有出现过“神童”,顶尖牌手的优势源于长期积累的桥牌语言与文献隐性知识,这皆是AI无法快速获取的。

作者通过7种游戏的人机博弈史,展示了这样一个真相:AI的胜利不是人类的失败,而是人类智慧的延伸。在棋盘与骰子的方寸之间,科学家、工程师,以及人类顶尖玩家们共同凿开了一条通往未来之路。今天的人类,借助各种游戏程序打磨技巧,分析棋谱,只因游戏的本质是“克服不必要障碍的自愿尝试”。对于真正的玩家,AI能否击败人类早已无关紧要,正如一个攀岩运动爱好者,绝不会因为直升机更擅长爬升,而放弃攀岩的乐趣。

人类与AI的关系,从来不是对抗,而是共生。作者坚信,人类直觉与机器算力的结合,代表着人机混合智能的必然趋势。技术奇点与超级智能并非灾难,而是人类面临的全新命题,是一场等待我们开启的宏大新游戏。