从'有关系'到'有因果'的判断流程

一套五步判断流程:拿到数据结论后从暂停、画因果图、排查假因果、匹配方法到评估证据强度,每步嵌入判断点和常见错法

本页目录

从"有关系"到"有因果"的判断流程

拿到一个数据结论后,按这套流程走一遍。不需要统计软件,不需要数学公式——需要的是一组固定的追问顺序。

最小闭环:只做前两步——暂停 + 画因果箭头。这两步能拦住日常里超过一半的因果误判。完整流程五步,适合需要做决策的场景。

先暂停,把"有道理"换成"凭什么"

触发条件:任何时候你看到一个数据支撑的结论——新闻、报告、汇报、论文摘要。

动作很简单:在脑子里把"有道理"替换成"凭什么说这是因果"。

不是怀疑数据本身。数据可能完全正确。要怀疑的是从数据到因果结论之间的那一步推理。"吃早餐的孩子成绩好"是数据事实,"吃早餐导致成绩好"是因果判断——两者之间差着一整套识别方法。

常见错法:跳过暂停直接行动。数据越漂亮(有图表、有p值、有大样本),越容易跳过这一步。

画一张因果图,标出所有可能的箭头

拿一张纸,画出涉及的变量,然后标箭头。

A→B(你听到的结论方向)只是可能性之一。还要画:

  • B→A(反向因果)
  • C→A 且 C→B(混淆变量)
  • A和B都受多个C影响(多重混淆)

画完之后,结论"A导致B"只有在排除了其他所有箭头之后才能成立。

做到什么程度算完成:至少画出三种可能的因果路径。如果只画了一种,说明还没认真想。

举个例子:"广告投放后销售涨了"。先画A(广告)→B(销售)。再画B→A(预期销售好才投广告)。再画C(旺季)→A 且 C→B。三条路径都标出来之后,你才看得清需要排除什么。

按顺序排查三种假因果

三种假因果有固定的排查顺序。先查最常见的,再查最隐蔽的。

第一查:混淆变量。 有没有一个你没放进因果图的C,同时影响了A和B?这是最高频的假因果来源。

判断方法:问自己"如果我能随机分组,还会看到同样的关系吗"。如果答案是"不确定",大概率有混淆变量。

第二查:反向因果。 A导致B,还是B导致A?看时间先后——但时间先后不等于因果方向。犯罪先于警察部署,不代表犯罪导致了更多犯罪。

判断方法:把A和B的位置互换,看互换后的故事是否同样说得通。如果两个方向都说得通,就需要用方法来分离。

第三查:选择偏误。 被比较的两组人本来就不一样吗?"做了X的人结果更好"可能只是因为选择做X的人本来就更好。

判断方法:想象你是分组的人——你会让什么样的人进入"做X"那组?如果进组理由和结果有关,选择偏误几乎一定存在。

排查做偏的信号:三种假因果只查了一种就停手。很多数据结论同时存在两到三种假因果,漏查一种就可能得出相反的结论。

匹配一种因果推断策略

排查完假因果的类型,下一步是想:有没有办法用数据和方法排除它。

五种方法各有适用条件:

随机对照实验——最干净,但需要你能控制分组。适用于:你有条件做A/B测试的场景(产品功能、营销策略、教学方式)。

自然实验——借助现实中碰巧发生的"准随机"事件。适用于:有政策变动、突发事件、地理差异等外部冲击的场景。

工具变量——找一个只通过正确路径影响结果的中间变量。适用于:无法直接分组但能找到合适工具的场景。门槛最高,工具是否"干净"经常有争议。

断点回归——利用分数线、年龄线等规则临界点。适用于:存在政策阈值,且阈值附近人群可比的场景。

双重差分——用"干预组vs对照组"叠加"前vs后"两层对比。适用于:干预发生在特定时间和特定群体,且能找到没被干预的对照组。

不需要你自己跑数据。需要的是:看到一个因果结论时,你能问"用了什么方法排除替代解释"。

判断做偏的信号:根据方法名选方法,而不是根据数据条件选方法。方法是为数据条件服务的,不是反过来。

证据够硬再行动,不够就标出来

最后一步不是"得出结论",而是"给结论标一个可信度"。

两个判断维度:

排除了多少种替代解释? 只排除了一种混淆变量的研究,和同时排除了混淆、反向因果和选择偏误的研究,可信度完全不同。

结论能推广到多远? 在某所大学的实验结果,不一定适用于所有大学。这是外部效度问题——方法再好,结论也有适用范围。

做到什么程度算完成:能用一两句话说清"这个结论排除了什么,没排除什么,适用范围多大"。如果说不清,就不要把它当成行动依据。

一页因果检查清单

步骤 核心追问 完成标准
暂停 凭什么说这是因果? 区分了"数据事实"和"因果判断"
画图 还有哪些可能的因果路径? 至少画出三种箭头方向
排查 混淆?反向?选择偏误? 三种假因果都过了一遍
匹配 用了什么方法排除替代解释? 能说出方法名和适用条件
评估 排除了多少,能推广多远? 能说清可信度和适用范围

同分类继续看