局面分类是起点
整套分析的第一步不是"我该怎么办",而是"我在什么类型的局里"。
分类维度有三个:博弈次数(一次性 vs. 重复)、信息结构(对称 vs. 不对称)、收益性质(零和 vs. 正和 vs. 负和)。三个维度的组合产生不同的博弈类型,每种类型有不同的均衡策略。
这个分类的价值在于:它把"这事该怎么处理"从一个无穷大的问题压缩成一个有限集合的匹配问题。你不需要从头发明策略,只需要识别类型然后调用已知的最优策略。
策略不是固定的,是对局面的响应
同一个人在不同局面里应该采取完全不同的策略。在一次性博弈里,强硬可能是最优的。在重复博弈里,同样的强硬可能摧毁长期合作的基础。
方法论的核心逻辑是:策略是局面结构的函数,不是性格的函数。
这意味着"我是一个合作型的人"或"我向来强硬"这类自我定义在博弈分析里没有意义。有意义的是:在当前局面的约束条件下,哪个策略的期望收益最高。
信号机制是连接行动和结果的桥梁
在信息不对称的博弈中,行动的直接效果往往不如它传递的信号重要。
降价的直接效果是利润减少。但降价传递的信号可能是"我们有成本优势,你跟不起"——这个信号的威慑效果可能远超降价本身的损失。
方法论上的启示:分析任何行动时,需要同时考虑两层——直接支付和信号效应。很多看起来"不划算"的行动,算上信号效应之后是划算的。反过来,很多看起来"占便宜"的行动,因为传递了错误信号,长期来看亏了。
均衡是分析的终点,不是行动的终点
博弈论的分析最终收敛到均衡——一个没有人有动力单方面改变策略的状态。
但均衡不是推荐。纳什均衡可能是所有人都不满意的结果(囚徒困境的双方背叛就是均衡,但双方合作明明更好)。知道均衡在哪里,是为了理解"如果每个人都按自利逻辑行动,事情会走到哪里"。
方法论的最后一步是:在理解均衡的基础上,判断是否有办法改变局面结构——引入重复、增加信息透明度、改变支付结构——从而把均衡推向一个更好的位置。改变局面比在局面里挣扎更有效。