本页目录

为什么读原因与结果的经济学

今年你至少听过三次"研究发现"开头的结论，然后默认它说的是因果关系。吃早餐的孩子成绩更好。读大学的人收入更高。每天一万步的人更长寿。

这些结论都有数据支撑。但它们可能只是相关。

成绩好的孩子背后通常有更稳定的家庭。那些家庭恰好也让孩子按时吃早餐。高收入者往往来自教育资源更多的环境，读大学可能只是结果的一部分。每天走一万步的人本身就更健康，走路是健康的表现，未必是原因。

"相关不等于因果"——你大概率早就听过。

靠这句话，拦不住日常里的假因果。假因果看起来和真因果一模一样：都有数据，都有统计量，都写着"显著"。区分它们靠的不是提醒，是方法。

数据越多，假因果越有说服力

数据时代的风险不是没有数据，是数据太多。一份有图有表的报告说"做了X的用户留存率高30%"，你很难不被打动。

但"做了X的用户"和"没做X的用户"本来就不同。选择做X的人可能更活跃、更年轻、更愿意尝试。高留存可能是人群差异，不是X的效果。

这类错误不需要恶意。它发生在每一个认真看数据、认真做决策的人身上。

缺的不是小心，是一套能拆开假因果的具体方法。

中室牧子和津川友介做了一件很具体的事。两位作者把经济学家识别因果关系的五种核心方法，用日常案例讲给非专业读者。

随机对照实验，把人随机分成两组，消除看不见的差异。自然实验，借现实中碰巧发生的"准随机"事件来比较。工具变量，找一个只通过正确路径影响结果的中间变量。断点回归，利用分数线、年龄线这类规则临界点。双重差分，用两层对比消除时间趋势。

五种方法不是并列选项。适用条件不同，能处理的问题不同。选哪种取决于手上有什么数据、现实允许什么比较。

书里不讲统计公式，不讲概率分布。只回答一个问题：看到"A和B有关"时，怎么判断A是不是真的导致了B。

最有用的教学设计是反面对照。每介绍一种因果推断方法，紧跟着展示：不用它会得出什么样的错误结论。

比如你想知道"增加警察数量能不能降低犯罪率"。直接比较警察多的城市和警察少的城市，你会发现：警察越多犯罪率越高。

但犯罪率高的城市本来就会部署更多警察。因果关系反了。

这种反面展示比正面讲解更容易记住：数据不是自己会说话的，它需要你带着正确的方法去问。

读完不会让你变成计量经济学家。但在三个场景里，反应会和以前不一样。

看到新闻里的"研究发现"，第一反应从"有道理"变成"它控制了什么变量"。

工作中看到一份报告说"做了X的用户留存更高"，你会先问：做X的人和不做X的人，是不是本来就不一样？

别人用数据说服你做决定，你会追问：证明的是相关还是因果？排除了哪些替代解释？

三个追问不需要跑回归分析。只需要知道：因果推断是一个可以用方法判断的问题，不是只能靠直觉的模糊地带。

市面上讲因果推断的书大致两类。一类是学术教材，门槛高、公式多，如安格里斯特的《基本无害的计量经济学》。另一类是泛科普读物，讲"数据会说谎"但不给方法。

《原因与结果的经济学》卡在中间。用例子代替公式，但每个例子对应一种正式的因果推断方法。读完能说出"这个问题可以用工具变量处理"或"这里需要断点回归"——而不只是记住"小心数据"这种空泛提醒。

对多数人来说，不需要自己跑回归。需要的是：当别人用数据得出因果结论时，能判断推理链条站不站得住。