本页目录

八句话把"有数据"和"有因果"拆开

因果判断的底层提醒

看到两件事同时出现，人的默认反应是"A导致了B"——而不是"A和B碰巧一起变动"。

所有因果推断错误的起点都在这里。人脑天生把共变当因果。意识到这个默认反应，才能在每次遇到数据结论时主动暂停。

反事实——"如果没有这个干预，本来会发生什么"——才是因果推断的起点，不是"干预之后发生了什么"。

因果效应不是"干预之后发生了什么"，而是"和没有干预的情况相比，差了多少"。但反事实永远无法直接观测，所有方法都是在想办法逼近它。

被比较的两组人如果本来就不一样，比较结果反映的是人群差异，不是干预效果。

选择偏误是最常见的假因果来源。"读大学的人收入更高"可能只是因为能读大学的人家庭条件本来就好。遇到任何分组比较，先问"两组人一开始是不是就不同"。

随机分组的价值不在公平，在于把看不见的干扰因素平均分到两边。

随机对照实验之所以是因果推断金标准，是因为随机化能让所有已知和未知的混淆变量在两组之间大致相等。这样观察到的差异才能归因于干预本身。

A和B同时变动时，先问：是不是有个没注意到的C在背后同时推动了它们。

冰淇淋销量和溺水人数正相关——推动两者的是夏天的高温。混淆变量是假因果的主要来源之一。每次看到相关性，画一张因果图，标出所有可能的第三方变量。

因果方向不是数据能自动告诉你的。A导致B还是B导致A，必须靠方法和逻辑去判断。

警察多的城市犯罪率高——不是警察导致犯罪，是犯罪多的地方部署更多警察。反向因果在政策讨论里特别常见，比正向因果更有迷惑性。

不能做实验不等于不能判断因果。现实中碰巧发生的"准随机"事件就是自然送来的实验机会。

很多因果问题不允许做随机实验——不能随机决定谁上大学谁不上。但义务教育法的变化、彩票中签、自然灾害这类事件碰巧制造了可以利用的"准随机"分组。

一个结论有多可信，取决于它排除了多少种替代解释。

因果推断的核心不是证明A导致B，而是排除A不导致B的可能性。排除得越多，结论越强。只控制了一两个变量的研究，通常不如控制了所有主要混淆的研究——哪怕前者样本量更大。