为什么读原因与结果的经济学

把'相关不等于因果'从一句口号变成五种可执行的判断方法,在遇到数据结论时拦住推理错误

本页目录

为什么读原因与结果的经济学

今年你至少听过三次"研究发现"开头的结论,然后默认它说的是因果关系。吃早餐的孩子成绩更好。读大学的人收入更高。每天一万步的人更长寿。

这些结论都有数据支撑。但它们可能只是相关。

成绩好的孩子背后通常有更稳定的家庭。那些家庭恰好也让孩子按时吃早餐。高收入者往往来自教育资源更多的环境,读大学可能只是结果的一部分。每天走一万步的人本身就更健康,走路是健康的表现,未必是原因。

"相关不等于因果"——你大概率早就听过。

靠这句话,拦不住日常里的假因果。假因果看起来和真因果一模一样:都有数据,都有统计量,都写着"显著"。区分它们靠的不是提醒,是方法。

数据越多,假因果越有说服力

数据时代的风险不是没有数据,是数据太多。一份有图有表的报告说"做了X的用户留存率高30%",你很难不被打动。

但"做了X的用户"和"没做X的用户"本来就不同。选择做X的人可能更活跃、更年轻、更愿意尝试。高留存可能是人群差异,不是X的效果。

这类错误不需要恶意。它发生在每一个认真看数据、认真做决策的人身上。

缺的不是小心,是一套能拆开假因果的具体方法。

五种方法各拆一种伪装

中室牧子和津川友介做了一件很具体的事。两位作者把经济学家识别因果关系的五种核心方法,用日常案例讲给非专业读者。

随机对照实验,把人随机分成两组,消除看不见的差异。自然实验,借现实中碰巧发生的"准随机"事件来比较。工具变量,找一个只通过正确路径影响结果的中间变量。断点回归,利用分数线、年龄线这类规则临界点。双重差分,用两层对比消除时间趋势。

五种方法不是并列选项。适用条件不同,能处理的问题不同。选哪种取决于手上有什么数据、现实允许什么比较。

书里不讲统计公式,不讲概率分布。只回答一个问题:看到"A和B有关"时,怎么判断A是不是真的导致了B。

每种方法配一个"不用会怎样"

最有用的教学设计是反面对照。每介绍一种因果推断方法,紧跟着展示:不用它会得出什么样的错误结论。

比如你想知道"增加警察数量能不能降低犯罪率"。直接比较警察多的城市和警察少的城市,你会发现:警察越多犯罪率越高。

但犯罪率高的城市本来就会部署更多警察。因果关系反了。

这种反面展示比正面讲解更容易记住:数据不是自己会说话的,它需要你带着正确的方法去问。

改变的不是知识量,是追问速度

读完不会让你变成计量经济学家。但在三个场景里,反应会和以前不一样。

看到新闻里的"研究发现",第一反应从"有道理"变成"它控制了什么变量"。

工作中看到一份报告说"做了X的用户留存更高",你会先问:做X的人和不做X的人,是不是本来就不一样?

别人用数据说服你做决定,你会追问:证明的是相关还是因果?排除了哪些替代解释?

三个追问不需要跑回归分析。只需要知道:因果推断是一个可以用方法判断的问题,不是只能靠直觉的模糊地带。

学术和科普之间有一个精确的位置

市面上讲因果推断的书大致两类。一类是学术教材,门槛高、公式多,如安格里斯特的《基本无害的计量经济学》。另一类是泛科普读物,讲"数据会说谎"但不给方法。

《原因与结果的经济学》卡在中间。用例子代替公式,但每个例子对应一种正式的因果推断方法。读完能说出"这个问题可以用工具变量处理"或"这里需要断点回归"——而不只是记住"小心数据"这种空泛提醒。

对多数人来说,不需要自己跑回归。需要的是:当别人用数据得出因果结论时,能判断推理链条站不站得住。

同分类继续看