本页目录

信息越多判断越准？数据说不是

做一个判断之前，你想收集更多信息。多看几个指标，多跑一轮分析，多听两个人的意见。

这个动作几乎从来不被质疑。谁会反对"掌握更多信息再做决定"？

Gerd Gigerenzer 反对。他带着一组认知科学家和数学家花了十几年做了一件事：用模拟实验和真实数据证明，在不确定环境下，简单到只看一条线索的决策规则，经常比考虑所有可用信息的复杂模型更准确。

这不是在替懒惰辩护。这是一个有数学支撑的结论：信息越多，过拟合风险越高；环境越不确定，简单规则的泛化能力越强。

偏差范式告诉你人有多蠢，Gigerenzer 问的是另一个问题

过去四十年的决策研究，主线是 Kahneman 和 Tversky 开创的偏差范式。人的判断系统有各种偏差——锚定、可得性、代表性。结论是：人不理性，需要纠偏。

Gigerenzer 不否认偏差存在。他质疑的是"理性"的标准。

如果理性的唯一标准是逻辑一致性和概率规则的严格遵守，人确实处处不达标。但如果理性的标准是在真实环境里做出足够好的决策，简单启发式的表现经常超过复杂优化。

这个立场建立在一组被称为"快速节俭启发式"的具体模型上。每个模型都有明确的搜索规则、停止规则和决策规则。每个模型的预测精度都在真实数据集上做了交叉验证。

偏差范式把人放在逻辑考试桌前打分。Gigerenzer 把人放回生态环境里测量表现。同一个被试、同一组决策，换一个评判标准，结论可以完全翻转。

"少即是多"听起来像禅宗。在 Gigerenzer 的框架里，它是一个可以被反驳的实证命题。

具体含义：在预测任务中，使用更少线索的启发式，在新数据上的准确率高于使用全部线索的回归模型。这不是因为少就好，而是因为参数越多的模型越容易拟合噪声——在训练数据上漂亮，在新数据上翻车。

这个效应不总是发生。它需要特定条件：环境不确定性高、可用样本有限、线索之间冗余度高。满足这些条件时，简单规则不是凑合，是最优策略。

不满足时，复杂模型重新占优。Gigerenzer 不回避这一点。这也是《简捷启发式》和"简单就好"的鸡汤之间的根本区别——它讲的是在什么条件下简单更准确，不是一律简单。

再认启发式：两个对象里只认识一个，就选那个。听起来粗糙到不像决策规则。但在预测城市规模、股票收益、体育比赛结果时，只靠"听没听过"做判断的人，成绩经常优于信息更充分的专家。原因是再认本身携带了大量压缩信息——你听过一个城市，通常因为它确实更大。

信息量最大优先：多条线索按效度排列，找到第一条能区分两个选项的线索就停。不加权、不整合、不回头。这条规则在物种识别、医疗诊断分流、消费者选择等领域的预测精度，接近甚至超过多元回归。

满意即止：逐个考察选项，第一个达到门槛的就选。不追求最优，不比较全部候选。Simon 半个世纪前提出这个概念，Gigerenzer 给了它数学地基和生态条件。

这三条规则的共同特征是：少搜索、少计算、快停止。你在日常生活里一直在用它们。差别在于你现在知道它们什么时候可靠、什么时候不可靠。

每条规则都由三个组件拼成：搜索规则（去哪里找信息）、停止规则（什么时候不找了）、决策规则（找到之后怎么选）。组件极简，但组合方式精确匹配不同的环境结构。

Gigerenzer 反对的不只是"人有偏差"这条叙事线。他同时反对"存在一条通用决策规则"。

人的认知系统不是一台通用计算机。它更像一个工具箱——里面装了很多简单工具，每个工具适配一类环境。在稳定、数据充分的环境里，逻辑推理和统计模型是好工具。在不确定、时间有限、信息成本高的环境里，快速节俭启发式是更好的工具。

关键不是哪类工具更高级。关键是你能不能识别当前环境，选对工具。

这个判断本身就需要环境识别技能。你面前的决策任务，不确定性有多高？可用样本有多少？多条线索之间是互相独立还是高度冗余？这三个问题的答案决定了你该拿起工具箱里的哪一把。

"简单规则好用"听起来像在鼓励凭直觉行事。但快速节俭启发式和直觉之间有一条清晰的分界线。

每条启发式都可以被形式化、被编程、被交叉验证。它们的搜索路径明确、停止条件明确、决策规则明确。它们快，不是因为跳过了思考，而是因为思考步骤被精简到了环境能支撑的最小集。

你从中拿到的，是一张工具清单和一组环境判断标准。读完后你不会变成更好的统计分析师。你会变成一个知道什么时候不需要统计分析就能做出好判断的人——以及知道什么时候确实需要。