本页目录

你在用 p 值的时候，还记得费舍尔当初要解决什么吗

以下六个场景不是考试题。它们帮你认出自己现在的状态：Salsburg 讲的那些发明故事，到底进了你的判断动作，还是只留在了记忆里。

上一次看到 p < 0.05，你的反应是什么

在用的人：先停下来确认零假设是什么、0.05 这条线在当前场景够不够严格、自己在用费舍尔的连续证据度量还是奈曼-皮尔逊的二元决策框架。

没在用的人：直接接受"显著"，或者直接写进报告。

关键不是你能不能讲出费舍尔的故事。是你在看到 p 值时，是否自动触发了一次"这个数字在这个场景里意味着什么"的判断。

在用的人：开始实验之前就写下零假设、随机化方案、判断标准和样本量。数据出来之后，按事先定好的规则判断。

没在用的人：先跑数据，再找合适的分析方法和阈值。

费舍尔在泡茶实验之前就确定了一切。先开枪再画靶的实验，不管 p 值多漂亮，都不是费舍尔框架里的有效实验。

在用的人：意识到对方大概率在用贝叶斯式的直觉解读——"真值有 95% 概率在这个范围里"。而奈曼的原意是"这种算法长期有 95% 的覆盖率"。如果决策需要的是前一种陈述，应该用贝叶斯可信区间。

没在用的人：点头，接受"95% 置信"这个说法，不觉得有什么需要追问的。

在用的人：先查它的数学基础和适用场景，再查它在学术界的位置。知道"不主流"不等于"不靠谱"——贝叶斯方法被压了五十年，不是因为数学有问题。

没在用的人：默认"没听说过 = 不成熟"或者"老师没教过 = 不重要"。

在用的人：先问这是回归均值还是真实趋势变化。如果前期数据包含大量随机波动，"回落"可能只是统计现象，不需要找原因。

没在用的人：立刻开始找因果解释——"他松懈了""市场变了""策略失效了"。

高尔顿发现回归均值是统计事实。把统计现象当因果机制处理，会导致你惩罚随机性、奖励运气。

在用的人：知道两种方法各有适用场景。频率方法在大样本、重复实验场景下表现稳定；贝叶斯方法在小样本、强先验信息场景下更灵活。争"哪个好"没有意义，关键是"在这个具体问题里哪个更合适"。

没在用的人：要么无感——"不知道有什么好争的"；要么凭印象站队——"贝叶斯更先进"或"频率学派更严谨"。

Salsburg 讲了一百年的学派之争，结论不是某一方赢了，是两种路径各有适用范围。如果你读完之后只多了立场、没多判断力，这些发明故事对你还没有生效。