本页目录
从"有关系"到"有因果"的判断流程
拿到一个数据结论后,按这套流程走一遍。不需要统计软件,不需要数学公式——需要的是一组固定的追问顺序。
最小闭环:只做前两步——暂停 + 画因果箭头。这两步能拦住日常里超过一半的因果误判。完整流程五步,适合需要做决策的场景。
先暂停,把"有道理"换成"凭什么"
触发条件:任何时候你看到一个数据支撑的结论——新闻、报告、汇报、论文摘要。
动作很简单:在脑子里把"有道理"替换成"凭什么说这是因果"。
不是怀疑数据本身。数据可能完全正确。要怀疑的是从数据到因果结论之间的那一步推理。"吃早餐的孩子成绩好"是数据事实,"吃早餐导致成绩好"是因果判断——两者之间差着一整套识别方法。
常见错法:跳过暂停直接行动。数据越漂亮(有图表、有p值、有大样本),越容易跳过这一步。
画一张因果图,标出所有可能的箭头
拿一张纸,画出涉及的变量,然后标箭头。
A→B(你听到的结论方向)只是可能性之一。还要画:
- B→A(反向因果)
- C→A 且 C→B(混淆变量)
- A和B都受多个C影响(多重混淆)
画完之后,结论"A导致B"只有在排除了其他所有箭头之后才能成立。
做到什么程度算完成:至少画出三种可能的因果路径。如果只画了一种,说明还没认真想。
举个例子:"广告投放后销售涨了"。先画A(广告)→B(销售)。再画B→A(预期销售好才投广告)。再画C(旺季)→A 且 C→B。三条路径都标出来之后,你才看得清需要排除什么。
按顺序排查三种假因果
三种假因果有固定的排查顺序。先查最常见的,再查最隐蔽的。
第一查:混淆变量。 有没有一个你没放进因果图的C,同时影响了A和B?这是最高频的假因果来源。
判断方法:问自己"如果我能随机分组,还会看到同样的关系吗"。如果答案是"不确定",大概率有混淆变量。
第二查:反向因果。 A导致B,还是B导致A?看时间先后——但时间先后不等于因果方向。犯罪先于警察部署,不代表犯罪导致了更多犯罪。
判断方法:把A和B的位置互换,看互换后的故事是否同样说得通。如果两个方向都说得通,就需要用方法来分离。
第三查:选择偏误。 被比较的两组人本来就不一样吗?"做了X的人结果更好"可能只是因为选择做X的人本来就更好。
判断方法:想象你是分组的人——你会让什么样的人进入"做X"那组?如果进组理由和结果有关,选择偏误几乎一定存在。
排查做偏的信号:三种假因果只查了一种就停手。很多数据结论同时存在两到三种假因果,漏查一种就可能得出相反的结论。
匹配一种因果推断策略
排查完假因果的类型,下一步是想:有没有办法用数据和方法排除它。
五种方法各有适用条件:
随机对照实验——最干净,但需要你能控制分组。适用于:你有条件做A/B测试的场景(产品功能、营销策略、教学方式)。
自然实验——借助现实中碰巧发生的"准随机"事件。适用于:有政策变动、突发事件、地理差异等外部冲击的场景。
工具变量——找一个只通过正确路径影响结果的中间变量。适用于:无法直接分组但能找到合适工具的场景。门槛最高,工具是否"干净"经常有争议。
断点回归——利用分数线、年龄线等规则临界点。适用于:存在政策阈值,且阈值附近人群可比的场景。
双重差分——用"干预组vs对照组"叠加"前vs后"两层对比。适用于:干预发生在特定时间和特定群体,且能找到没被干预的对照组。
不需要你自己跑数据。需要的是:看到一个因果结论时,你能问"用了什么方法排除替代解释"。
判断做偏的信号:根据方法名选方法,而不是根据数据条件选方法。方法是为数据条件服务的,不是反过来。
证据够硬再行动,不够就标出来
最后一步不是"得出结论",而是"给结论标一个可信度"。
两个判断维度:
排除了多少种替代解释? 只排除了一种混淆变量的研究,和同时排除了混淆、反向因果和选择偏误的研究,可信度完全不同。
结论能推广到多远? 在某所大学的实验结果,不一定适用于所有大学。这是外部效度问题——方法再好,结论也有适用范围。
做到什么程度算完成:能用一两句话说清"这个结论排除了什么,没排除什么,适用范围多大"。如果说不清,就不要把它当成行动依据。
一页因果检查清单
| 步骤 | 核心追问 | 完成标准 |
|---|---|---|
| 暂停 | 凭什么说这是因果? | 区分了"数据事实"和"因果判断" |
| 画图 | 还有哪些可能的因果路径? | 至少画出三种箭头方向 |
| 排查 | 混淆?反向?选择偏误? | 三种假因果都过了一遍 |
| 匹配 | 用了什么方法排除替代解释? | 能说出方法名和适用条件 |
| 评估 | 排除了多少,能推广多远? | 能说清可信度和适用范围 |