八句话把"少即是多"从直觉变成判断工具
什么时候该停止收集信息
更多信息、更多计算、更多时间并不总是更好。在不确定性高的世界里,少即是多。
你在做决策前多查一轮数据,多跑一个模型,多征求一个意见。这些动作感觉在降低风险。但每多纳入一条信息,模型就多了一个拟合噪声的机会。当环境变化快、样本有限时,那些额外信息经常让你的预测更差,不是更好。
"少即是多"不是在劝你偷懒。它是在提醒你:信息有收益,也有成本;超过某个点之后,追加的信息带来的噪声会盖过信号。
好的启发式不是一个退而求其次的凑合,而是一种匹配环境结构的适应工具。
你用简单规则做判断,不是因为没时间做更细的分析。是因为在这个环境里,简单规则的泛化能力比复杂模型更强。
判断一个决策工具好不好,不看它在已有数据上拟合得多漂亮。看它在新数据上预测得多准。
你已经有一个比你以为的更准的判断信号
如果你认出一个对象而认不出另一个,就选你认出的那个。
再认启发式听起来像在开玩笑。两个城市哪个更大?我听过这个,没听过那个,就选听过的。
但再认不是随机的。你之所以认识一个城市,通常因为它被提到的频率更高——而提及频率和实际规模高度相关。一条看似粗糙的线索,背后压缩了大量你没有刻意学过的环境信息。
在多项交叉验证中,只靠再认做判断的被试,预测准确率超过了拥有完整数据的统计模型。
找到第一条能区分两个选项的线索就停。不加权,不整合,不回头。
信息量最大优先策略只做一件事:把线索按区分能力排队,用第一条能给出答案的线索做决定,剩下的全不看。
这条规则在医疗分流、信贷审批、物种分类里的准确率,和用全部可用信息做加权回归的复杂模型持平——有时更高。
秘密在于:少看几条线索意味着少拟合几个噪声参数。在小样本和高不确定性环境里,这是硬优势。
复杂模型最容易在哪里翻车
一个模型在已知数据上拟合得越好,在新数据上翻车的概率越高。
过拟合是统计学的基本概念,但在日常决策里很少有人当真。你花了一周搭了一个漂亮的评估框架,八个维度,每个维度三档评分,加权汇总。在历史数据上回测效果不错。
换一批新数据,表现暴跌。因为那个框架学到的不只是规律——它同时学到了上一批数据里的偶然波动。维度越多,学到的偶然越多。
如果你不确定未来数据会不会跟过去长得一样,模型越简单越安全。
生态理性不问一个策略是否符合逻辑规则,而问它在特定环境里表现如何。
理性有两种衡量标准。一种是逻辑一致性:你的偏好排序传递吗?你的概率判断满足贝叶斯规则吗?按这个标准,人处处不达标。
另一种是生态理性:在你实际面对的环境里,你的决策策略能不能产出好结果?按这个标准,很多被判定为"偏差"的简单策略,表现优于教科书上的正确答案。
一把锤子不符合螺丝刀的逻辑。但在钉钉子这件事上,它是对的工具。
什么时候复杂分析确实不可替代
启发式不是万能的。它的优势只在特定的环境结构下成立。
线索之间冗余度低、样本量大、环境变化慢——满足这三个条件,复杂模型重新占优。Gigerenzer 不否认这一点。
"少即是多"成立的前提是:不确定性高,样本有限,线索之间高度相关。拿掉这些前提,简单规则的优势消失。
这句话是整本书的安全阀。它在提醒你不要把"少即是多"本身也变成一条不检查前提就硬套的启发式。
问题不是该用简单规则还是复杂模型,而是你能不能判断当前环境适合哪一种。
工具箱里既有锤子也有螺丝刀。争论"锤子好还是螺丝刀好"没有意义。有意义的问题是:你面前的这颗钉子还是螺丝?
读完这本书之后,你的默认反应不应该变成"简单就好"。应该变成"先看环境再选工具"。