本页目录
你在用 p 值的时候,还记得费舍尔当初要解决什么吗
以下六个场景不是考试题。它们帮你认出自己现在的状态:Salsburg 讲的那些发明故事,到底进了你的判断动作,还是只留在了记忆里。
上一次看到 p < 0.05,你的反应是什么
在用的人:先停下来确认零假设是什么、0.05 这条线在当前场景够不够严格、自己在用费舍尔的连续证据度量还是奈曼-皮尔逊的二元决策框架。
没在用的人:直接接受"显著",或者直接写进报告。
关键不是你能不能讲出费舍尔的故事。是你在看到 p 值时,是否自动触发了一次"这个数字在这个场景里意味着什么"的判断。
设计实验时,你是先定规则还是先看数据
在用的人:开始实验之前就写下零假设、随机化方案、判断标准和样本量。数据出来之后,按事先定好的规则判断。
没在用的人:先跑数据,再找合适的分析方法和阈值。
费舍尔在泡茶实验之前就确定了一切。先开枪再画靶的实验,不管 p 值多漂亮,都不是费舍尔框架里的有效实验。
有人说"置信区间是 95%",你会追问吗
在用的人:意识到对方大概率在用贝叶斯式的直觉解读——"真值有 95% 概率在这个范围里"。而奈曼的原意是"这种算法长期有 95% 的覆盖率"。如果决策需要的是前一种陈述,应该用贝叶斯可信区间。
没在用的人:点头,接受"95% 置信"这个说法,不觉得有什么需要追问的。
遇到一种没听说过的统计方法,你怎么判断
在用的人:先查它的数学基础和适用场景,再查它在学术界的位置。知道"不主流"不等于"不靠谱"——贝叶斯方法被压了五十年,不是因为数学有问题。
没在用的人:默认"没听说过 = 不成熟"或者"老师没教过 = 不重要"。
看到"连续上升后回落",你的第一解释是什么
在用的人:先问这是回归均值还是真实趋势变化。如果前期数据包含大量随机波动,"回落"可能只是统计现象,不需要找原因。
没在用的人:立刻开始找因果解释——"他松懈了""市场变了""策略失效了"。
高尔顿发现回归均值是统计事实。把统计现象当因果机制处理,会导致你惩罚随机性、奖励运气。
有人在争"频率学派好还是贝叶斯好",你怎么参与
在用的人:知道两种方法各有适用场景。频率方法在大样本、重复实验场景下表现稳定;贝叶斯方法在小样本、强先验信息场景下更灵活。争"哪个好"没有意义,关键是"在这个具体问题里哪个更合适"。
没在用的人:要么无感——"不知道有什么好争的";要么凭印象站队——"贝叶斯更先进"或"频率学派更严谨"。
Salsburg 讲了一百年的学派之争,结论不是某一方赢了,是两种路径各有适用范围。如果你读完之后只多了立场、没多判断力,这些发明故事对你还没有生效。