锦标赛、堑壕和参议院——合作在不同结构下的命运

本页目录

四行代码击败六十三个对手

两轮计算机锦标赛是全书的实验基石。第一轮收到 14 个策略程序，第二轮收到 63 个。参赛者包括博弈论专家、心理学家、政治学者和计算机科学家，每个人都能看到第一轮的完整结果，有充足时间设计更好的策略。

一报还一报两次都赢了。它的全部代码可以用四行写完：开局合作，之后复制对方上一步的选择。

容易误判的地方在"赢"的含义。一报还一报从来不在任何一场单独对局中击败对手——它的得分最多只能和对手持平。它赢的方式是：和善良策略交手时双方都拿高分，和恶意策略交手时迅速止损。累计下来，它的总分最高。

这个结果指向一条反直觉的竞争逻辑：在重复博弈中，追求"赢过对方"的策略不如追求"和对方一起赢"的策略。嫉妒——试图在每场对局中占上风——是排名靠后的策略最共同的特征。

调用场景：当你发现自己在一段长期关系中计算"谁占了便宜"，或者试图用复杂策略从合作伙伴那里多榨一点，锦标赛的结果值得回看。赢不是在单局中压过对方，而是在多轮交互中积累总回报。

一战西线堑壕战是全书最有力的历史验证。英德两军长期对峙，双方士兵近距离相对，每天都在同一段战线上和同一批敌人打交道。

在没有任何明确协议的情况下，前线士兵自发形成了一套互惠系统：不在吃饭时间开枪，不瞄准对方的补给线，炮击故意偏离目标。一方如果打破默契突然开火，另一方会在下一轮精确报复——打中对方之前刻意放过的目标，释放"我们能做到但选择不做"的信号。

军方高层多次试图破坏这种默契。最终有效的手段不是惩罚士兵，而是频繁轮换部队——让每个连队不再和同一批敌人对峙。一旦对面换了人，"未来的影子"消失，合作立刻瓦解。

这个案例为什么重要：它证明合作的涌现不依赖善意、友情或共同身份。互为敌人的士兵之间产生合作，唯一的原因是博弈结构——重复、可观察、对称回报。当指挥官改变了结构（轮换部队），合作就消失了。

美国参议院的互惠规范是书中另一组验证。参议员们需要在数百项法案上反复投票、结成临时联盟。一个参议员可能在这项法案上反对你，下一项法案上又需要你的支持。

在这种高频重复互动中，"欠人情"和"还人情"形成了稳定的合作网络。新当选的参议员很快学会：即使意识形态对立，对具体的人讲互惠也是长期最优策略。不是因为他们喜欢对方，而是因为不讲互惠的参议员会发现自己在每一个需要盟友的场合都被孤立。

和堑壕案例的区别在于：参议院的合作有制度化基础（长期任职、反复投票、小群体互相认识），堑壕的合作完全是自发的。两者的共同点是"未来的影子"足够长、行为可追溯、群体规模足够小。

阿克塞尔罗德和进化生物学家汉密尔顿合作，把合作框架推广到生物界。无花果蜂和无花果树的互利共生、吸血蝙蝠的食物分享——这些行为在进化生物学中长期被视为利他主义的证据。

重新用囚徒困境框架审视后，画面变了：这些不是利他行为，而是在反复互动中形成的互惠均衡。吸血蝙蝠和同伴分享血液，不是因为慷慨，而是因为它们夜夜回到同一群体——不分享的个体下次挨饿时不会得到帮助。

这组证据的价值不在于生物学本身，而在于它把合作框架的适用范围从"理性行为者的有意识选择"扩展到"没有意识和意图的进化过程"。合作不需要思考，甚至不需要大脑——只需要重复博弈结构存在。