定义改一个词,禁区就打开了
衡量是基于一次或多次观察,以定量方式减少不确定性。
多数人拒绝衡量,是因为把衡量等同于精确计数。一旦把标准从"知道准确值"换成"缩小不确定性范围",几乎所有被宣布为"不可衡量"的东西都重新进入讨论范围。
从 100% 不确定到 70% 不确定,就是衡量。不需要消除不确定性,只需要减少它到足以改变决策的程度。
如果一件事和你的决策相关,它就是可观察的;如果它是可观察的,就可以被量化为某个范围;如果可以被量化为范围,它就可以被衡量。
这三步推导是全书的逻辑地基。每次有人说"没法衡量",反向走一遍这条链:它影响决策吗?影响的话,它通过什么方式可以被观察到?能被观察到的东西,就能被量化到某个范围。
链条很短。砍掉的是最常见的逃避借口。
你的判断有用,但别信你自以为的确定程度
未经校准的专家给出的 90% 置信区间,真实命中率通常只有 50% 到 70%。
所有人都以为自己知道自己有多确定。Hubbard 的实验反复证明,几乎所有人都高估了自己的确定程度。你说"90% 把握"的事情,其实只有一半到七成的概率落在你给的范围里。
校准不是让你变聪明,是让你知道自己有多不确定。把这份不确定性诚实地放进决策,比假装确定再赌一把要安全得多。
测量之前先问"测它值多少钱"
组织最看重的东西——投资回报率、客户满意度、质量——往往是它们最后才尝试去衡量的。
容易测的东西被测得极精确;难测但影响巨大的东西被搁置。信息价值分析的第一步就是问:如果完全知道这个变量的真实值,你的决策会变吗?
如果不会变,你正在浪费资源。如果会变,你正在浪费机会。
Hubbard 发现,他接手的每一个项目中,信息价值最高的变量几乎都是管理层认为"不可衡量"的那几个。需要测的东西,恰恰是被放弃测的东西。
在衡量之前,先算衡量本身值多少钱。
多数测量项目上来就讨论用什么工具、要多少样本、精度目标是多少。Hubbard 把一个前置问题放在最前面:完美信息的期望价值(EVPI)。
EVPI 为零的变量,用多精密的方法测都是浪费。EVPI 极高的变量,即使粗测一次也值得。先算 EVPI,再决定测不测、怎么测、投入多少。
小样本的力量被严重低估
如果你面临的不确定性很大,你不需要很多数据就能显著降低它。
从"完全不知道"到"大致有谱"这个跳跃里,五个随机观察就有 93.75% 的概率把总体中位数圈进最大值和最小值之间。
统计学课教的"样本要大"没错,但那是精密分析的要求。对付决策僵局,极少量的数据往往就有极大的边际价值。不确定性越大,每一个新观察的信息密度越高。
别等完美答案,每次观察都在缩小范围
用你已经知道的东西开始,每一个新的观察都会让你的估计变得更好。
贝叶斯更新不要求你从零开始。你对一件事总有某种程度的了解——行业经验、类似案例、直觉判断。把它当作起点,每获得一个新信息就修正一次。
完美数据是终点,不是起跑条件。等完美数据的组织,往往输给了用不完美数据持续更新判断的组织。
场景对照:什么时候调用哪句
决策会议上有人宣布某项指标"没法量化"——调用第 1、2 句,把"衡量"的标准从精确计数拉回到不确定性缩减。那个变量不是不能测,是对"测"的标准设太高了。
你或同事对一个关键判断"很有把握"但拿不出数据——调用第 3 句,区分"我觉得很确定"和"我的确定程度经过校准"。没做过校准练习的话,你的把握打六折比较诚实。
团队打算花大预算做全面调研——调用第 4、5 句,先算信息价值再决定投入规模。值一万块信息的变量,不要花十万去测。
有人说"我们没有足够的数据来做判断"——调用第 6 句,五个随机观察就够把判断从"纯猜"推进到"有范围"。先让讨论动起来。
需要快速做出一个原本"要等数据"的决定——调用第 7 句,用已有信息给出初始估计,然后随着新信息持续修正。不做完美决策,做可迭代的决策。