信息越多判断越准?数据说不是

Gigerenzer 用模拟和实证证明,在不确定环境里简单启发式经常比复杂模型更准确——不是因为人懒,而是因为少即是多。

本页目录

信息越多判断越准?数据说不是

做一个判断之前,你想收集更多信息。多看几个指标,多跑一轮分析,多听两个人的意见。

这个动作几乎从来不被质疑。谁会反对"掌握更多信息再做决定"?

Gerd Gigerenzer 反对。他带着一组认知科学家和数学家花了十几年做了一件事:用模拟实验和真实数据证明,在不确定环境下,简单到只看一条线索的决策规则,经常比考虑所有可用信息的复杂模型更准确。

这不是在替懒惰辩护。这是一个有数学支撑的结论:信息越多,过拟合风险越高;环境越不确定,简单规则的泛化能力越强。

偏差范式告诉你人有多蠢,Gigerenzer 问的是另一个问题

过去四十年的决策研究,主线是 Kahneman 和 Tversky 开创的偏差范式。人的判断系统有各种偏差——锚定、可得性、代表性。结论是:人不理性,需要纠偏。

Gigerenzer 不否认偏差存在。他质疑的是"理性"的标准。

如果理性的唯一标准是逻辑一致性和概率规则的严格遵守,人确实处处不达标。但如果理性的标准是在真实环境里做出足够好的决策,简单启发式的表现经常超过复杂优化。

这个立场建立在一组被称为"快速节俭启发式"的具体模型上。每个模型都有明确的搜索规则、停止规则和决策规则。每个模型的预测精度都在真实数据集上做了交叉验证。

偏差范式把人放在逻辑考试桌前打分。Gigerenzer 把人放回生态环境里测量表现。同一个被试、同一组决策,换一个评判标准,结论可以完全翻转。

少即是多不是哲学态度,是可测量的效应

"少即是多"听起来像禅宗。在 Gigerenzer 的框架里,它是一个可以被反驳的实证命题。

具体含义:在预测任务中,使用更少线索的启发式,在新数据上的准确率高于使用全部线索的回归模型。这不是因为少就好,而是因为参数越多的模型越容易拟合噪声——在训练数据上漂亮,在新数据上翻车。

这个效应不总是发生。它需要特定条件:环境不确定性高、可用样本有限、线索之间冗余度高。满足这些条件时,简单规则不是凑合,是最优策略。

不满足时,复杂模型重新占优。Gigerenzer 不回避这一点。这也是《简捷启发式》和"简单就好"的鸡汤之间的根本区别——它讲的是在什么条件下简单更准确,不是一律简单。

三个你已经在用但没命名过的启发式

再认启发式:两个对象里只认识一个,就选那个。听起来粗糙到不像决策规则。但在预测城市规模、股票收益、体育比赛结果时,只靠"听没听过"做判断的人,成绩经常优于信息更充分的专家。原因是再认本身携带了大量压缩信息——你听过一个城市,通常因为它确实更大。

信息量最大优先:多条线索按效度排列,找到第一条能区分两个选项的线索就停。不加权、不整合、不回头。这条规则在物种识别、医疗诊断分流、消费者选择等领域的预测精度,接近甚至超过多元回归。

满意即止:逐个考察选项,第一个达到门槛的就选。不追求最优,不比较全部候选。Simon 半个世纪前提出这个概念,Gigerenzer 给了它数学地基和生态条件。

这三条规则的共同特征是:少搜索、少计算、快停止。你在日常生活里一直在用它们。差别在于你现在知道它们什么时候可靠、什么时候不可靠。

每条规则都由三个组件拼成:搜索规则(去哪里找信息)、停止规则(什么时候不找了)、决策规则(找到之后怎么选)。组件极简,但组合方式精确匹配不同的环境结构。

工具箱而非万能钥匙

Gigerenzer 反对的不只是"人有偏差"这条叙事线。他同时反对"存在一条通用决策规则"。

人的认知系统不是一台通用计算机。它更像一个工具箱——里面装了很多简单工具,每个工具适配一类环境。在稳定、数据充分的环境里,逻辑推理和统计模型是好工具。在不确定、时间有限、信息成本高的环境里,快速节俭启发式是更好的工具。

关键不是哪类工具更高级。关键是你能不能识别当前环境,选对工具。

这个判断本身就需要环境识别技能。你面前的决策任务,不确定性有多高?可用样本有多少?多条线索之间是互相独立还是高度冗余?这三个问题的答案决定了你该拿起工具箱里的哪一把。

为什么这套思路比"相信直觉"硬得多

"简单规则好用"听起来像在鼓励凭直觉行事。但快速节俭启发式和直觉之间有一条清晰的分界线。

每条启发式都可以被形式化、被编程、被交叉验证。它们的搜索路径明确、停止条件明确、决策规则明确。它们快,不是因为跳过了思考,而是因为思考步骤被精简到了环境能支撑的最小集。

你从中拿到的,是一张工具清单和一组环境判断标准。读完后你不会变成更好的统计分析师。你会变成一个知道什么时候不需要统计分析就能做出好判断的人——以及知道什么时候确实需要。

同分类继续看