谈薪水、投标、选技术路线——大部分重要决定的结果,不只由你一个人说了算。
对方怎么出牌,直接改写你的最优选择。经济学的思维方式处理个人在稀缺中如何决策;但只要对面坐着另一个也在优化的人,单人决策框架就不够了。弗登博格和梯若尔的《博弈论》处理的正是这层互依。
对方的最优反应,才是关键变量
一个人面对价格做购买决定,是个人决策。两家公司互相盯着定价——你降我也降、你不降我偷偷降——就成了博弈。
纳什均衡说的是一种稳定状态。每个参与者在给定对方选择的前提下,已经做到了自己的最优。没有人想单方面改变。
这改变了"最优解"的含义。
不是"我能拿到的最好结果";而是"在对方也在算计的前提下,我能稳定待住的位置"。
先动后动不是时间问题
日常直觉把"谁先出手"当时间先后。博弈论把它处理成信息结构:先动者的选择被后动者看到,后动者据此调整。
子博弈精炼均衡检验的是威胁的可信度。如果执行威胁对威胁者自己不利,理性对手不会信。
谈判里最常见的空头支票就属于这类。"你不接受我就退出"——对方会默默算一遍:你真退出的成本有多高?成本太高,威胁无效。
你不知道对方知道什么
完全信息博弈假设所有人都知道彼此的收益结构。现实几乎不满足。
不完全信息博弈引入"类型"概念。对方可能成本高也可能成本低,你不确定;只能从行为去推断——这就是贝叶斯博弈。
信号传递从这里长出来。高能力者愿意花大成本发信号——比如读一个昂贵的学位。低能力者模仿不起,信号因此可信。
信号有没有用,不看内容本身,看模仿成本。
一次交手和长期关系,逻辑完全不同
囚徒困境单次博弈的纳什均衡是双方都背叛。但如果同样两个人反复交手、未来足够重要,合作就能被维持。
重复博弈的民间定理说:只要参与者足够在意未来收益,几乎任何合作结果都有办法支撑——靠的是"你叛我罚"的惩罚策略。
长期商业伙伴之间合作更常见,不是因为人好。未来还要打交道,背叛代价变高了。
留下的不是公式
形式化教材的价值不在公式本身。几个判断习惯能长期留在日常思维里。
做选择前先画对方的决策树。你降价,对方跟不跟?你承诺,对方信不信?策略不是在真空里选的。
看到一个稳定局面,先问"有没有人单独偏离能获利"。有人偏离就获利,这个局面撑不住。
遇到信息不对称,先想"谁有动机伪装、伪装成本多高"。
区分一次交手和长期关系。一次博弈里的最优策略,放进长期关系可能是最差的选择。