本页目录

博弈论不是一个模型，是一组拆局工具

博弈论和大部分决策方法有一个根本区别：它不假设你是唯一的决策者。

决策分析问的是"给定一堆选项和概率，我怎么选最好"。博弈论问的是"我和另一个也在想的人同时做选择，结果取决于两个人的组合，怎么办"。

这个区别看起来只是多了一个变量，实际上改变了分析的整个底座。你不能只优化自己——因为你的最优选择取决于对方的选择，而对方也在想同样的事。

两种基本博弈，两种基本工具

迪克西特和奈尔巴夫把博弈分成两大类，每一类配一个核心分析工具。

先后行动博弈：用倒推法。 一方先动，另一方看到后再动。象棋、谈判、最后通牒——行动有时间顺序。分析方式是画博弈树，从终点往回推。每个节点上，行动方选对自己最好的；知道了后面的选择，前面的选择就确定了。

倒推法的核心不是"想远一点"，而是"从结局倒着想"。方向不同，结论经常不同。一个常见的例子：两个人分一笔钱，先出价的人如果知道对方会拒绝太低的报价，倒推之后就不会出价太低——出价策略从终点的拒绝条件开始算，而不是从"我想多拿"开始算。

同时行动博弈：用纳什均衡。 双方同时决策，互相不知道对方选了什么。密封投标、定价竞争、军备竞赛。分析方式是画收益矩阵，找纳什均衡——每一方在对方策略给定时，都不想改变自己选择的那个策略组合。

纳什均衡不是"最好结果"。囚徒困境的纳什均衡是双方都背叛，但双方都合作其实更好。均衡只是说"没有人有动机单方面偏离"。理解这个区别很重要——均衡可以是坏结果。

改变博弈的三种杠杆

分析完博弈结构，下一个问题是：你能不能改变博弈本身？

承诺改变选择空间。 主动缩减自己的选项，让对方的计算方式改变。不可逆的合同、公开声明、沉没成本——承诺的本质是自我约束。关键不在于你想不想守承诺，在于对方信不信。可信承诺需要三个条件：可见性（对方看得到）、不可逆性（你撤不回来）、成本可观（撤回的代价你自己也承受不起）。

信号改变信息结构。 博弈中经常有一方掌握私有信息。信号是你主动暴露信息的方式——但只有当暴露成本在不同类型之间不对称时，信号才有效。质保是信号，因为劣质品提供质保成本极高。名校文凭是信号，因为能力差的人拿到名校文凭的成本更高。

筛选是信号的反面——不是你主动暴露，而是对方设计机制逼你暴露。保险公司设免赔额来筛选高风险和低风险客户；雇主设试用期来筛选员工能力。

重复改变合作条件。 一次性博弈里，囚徒困境几乎必然走向背叛。但如果博弈重复进行，合作就有可能。条件是：预期互动足够长、背叛可被观察、惩罚够快够痛。

"未来的影子"是一个精确的概念：如果双方都认为还会继续打交道，当前一次背叛换来的好处就会被未来多次惩罚抵消。影子越长，合作越稳。打折因子（对未来收益的看重程度）是决定合作能否维持的关键参数。

三个工具之间的关系不是并列的。承诺和信号解决的是"怎么让对方相信你"的问题；重复博弈解决的是"怎么让合作自我维持"的问题。前者是主动操作，后者是结构利用。很多时候你需要同时考虑：先用信号建立信任，再用重复博弈维持合作。

还有一个容易被忽视的工具：机制设计。迪克西特和奈尔巴夫讨论了拍卖、投票、合同设计等场景——这些不是在给定博弈里选策略，而是在设计博弈本身。密封投标还是公开竞价？利润分成还是固定价格？不同机制会导致完全不同的均衡行为。能改变游戏规则的人，比只能在规则内选择的人多了一整个维度的策略空间。

混合策略：不可预测的价值

当纯策略没有稳定均衡时——你选A对方选B更好，你选B对方选A更好——纳什均衡要求混合策略：随机化你的选择。

混合策略的直觉很简单：如果对方能预测你选什么，他就能提前做出最优反应。让自己不可预测，等于剥夺了对方的信息优势。

足球罚点球、网球发球、军事部署、定价竞争——任何零和或接近零和的互动中，混合策略都有天然的位置。关键是随机化的比例不是乱来的，它由收益矩阵里的具体数字决定。

工具之间怎么接

博弈论不是一条线性流程。分析一个真实问题，经常需要多个工具组合。

典型的分析路径：先判断博弈类型（先后还是同时、一次还是重复、信息是否对称），再用对应工具分析均衡，最后看有没有可用的战略杠杆。

但路径不是固定的。一个谈判可能既有先后行动部分（谁先出价），又有同时行动部分（双方同时决定是否接受），还有重复博弈的影子（以后还要合作）。工具需要叠加，不是非此即彼。

迪克西特和奈尔巴夫在这里做了一件教科书通常不做的事：他们不只教每个工具怎么用，还反复示范在复杂场景里怎么组合。这种"工具箱"思路比记住某一个模型更有持久价值。

方法的核心分水岭

整套博弈分析方法的关键分叉点只有一个：你有没有正确识别博弈类型。

如果把同时行动的博弈错认为先后行动，你会去画一棵不存在的博弈树。如果把重复博弈当成一次性博弈，你会过早放弃合作。如果以为对方和你信息对称，你会忽略信号的价值。

这个分水岭不是在分析的某一步发生的，而是在最开始——你怎么理解眼前的局面。后面的所有分析工具选择、杠杆判断、策略制定，都建在这个理解之上。理解错了，后面越精确越危险。

大多数人在实际使用中犯的第一个错误，不是工具用得不好，而是从一开始就没有花足够时间确认自己在什么类型的博弈里。

一句核心判断

博弈论的核心不是某个均衡概念或某个定理。它是一个思维转向：从"我怎么选最好"变成"在对方也在想的情况下，我怎么选最好"。

这个转向一旦建立，倒推法、纳什均衡、承诺、信号、重复博弈——所有工具都是这个转向的展开。没有这个转向，工具学了也用不上。

方法的适用边界和承诺、信号、重复博弈的有效前提已在 06 中展开。

迪克西特和奈尔巴夫的教学组织方式

值得单独说一下的，是两位作者组织这些工具的顺序。

他们没有先教数学再讲应用。而是反过来：先给你一个日常场景（选举策略、工资谈判、军备竞赛），让你先感受到"这里面有结构"，再引入模型。这个教学路径让博弈论的入门门槛比大多数教科书低得多。

这种组织方式本身就是一个方法论选择：工具的记忆和使用不靠抽象学习，靠场景绑定。当你在某个场景里学会了一个工具，下次遇到类似场景时工具就会自动激活。

对于读者来说，这意味着读完以后最有效的复习方式不是重新翻书，而是在遇到策略互动时主动尝试用博弈框架分析一遍。用过一次比读过三次更管用。

博弈论不是一个模型，是一组拆局工具

博弈论不是一个模型，是一组拆局工具

两种基本博弈，两种基本工具

改变博弈的三种杠杆

混合策略：不可预测的价值

工具之间怎么接

方法的核心分水岭

一句核心判断

迪克西特和奈尔巴夫的教学组织方式

段落笔记

记下这一段

同分类继续看

好好讲道理

控制论与科学方法论

批判性思维工具

把今天读什么装到主屏幕