本页目录
面对长期停滞信号时的假说检验流程
经济增速持续低于趋势值超过三年,主流政策手段效果不明显,公共讨论中已经出现多种竞争性解释——这些信号同时出现时,单一框架分析的可靠性就不够了。需要一套系统的假说检验流程。
下面的流程从村濑信也对日本停滞的分析方法中提炼而来,但不限于日本。任何多因素交织的长期停滞都可以用同一套逻辑。
候选假说先全部摆出来,不要一开始就选边
启动检验时,先把所有能找到的解释全部列出。
不要筛选。不要排序。先做到穷尽。
日本停滞的候选假说至少有六个:银行坏账堵塞信贷、资产负债表衰退、需求不足、结构僵化、人口转折、通缩预期自我实现。面对其他经济体的停滞,候选假说可能不同,但列举原则一样:先穷尽再筛选。
列举的来源:学术文献、政策报告、市场分析、媒体讨论、当事者回忆录。不同来源的假说覆盖面不同。只看学术文献会漏掉制度性因素,只看市场分析会漏掉结构性因素。
列举时避免一个陷阱:把同一种解释的不同表述当成不同假说。"企业不投资"和"企业在还债"可能是同一个假说的两种说法。合并之后再检验,避免重复计算。
最小版:列出不少于四个独立假说。如果只能找到两三个,说明信息收集还不够。
每个假说用数据做正反测试
每个假说都需要回答两个问题:如果这个假说成立,数据上应该看到什么?实际数据和预测吻合吗?
银行坏账假说预测信贷萎缩。实际数据支持——日本银行信贷在1990年代持续下降。但它也预测企业缺乏融资渠道。数据不支持——企业部门整体处于净储蓄状态,手里有钱。支持和反对各占一半,这个假说不能被完全采纳,也不能被完全排除。
人口假说预测劳动力减少和消费收缩。长期数据支持。但它也预测经济放缓是渐进的。数据不支持——1990年代初的增速下降是急剧的。时间线上的错位削弱了因果关系。
对每个假说,列出三栏:
- 支持证据:什么数据符合预测
- 反对证据:什么数据和预测矛盾
- 中性证据:数据模糊,无法判断
如果一个假说的反对证据涉及核心预测(不是边缘预测),它的权重就要大幅下调。
最小版:先对最被广泛接受的那个假说做正反测试。如果连最流行的假说都有明显缺口,就有必要继续检验其他假说。
假说之间的关系比单个假说更重要
单独检验每个假说之后,接下来看它们之间的关系。
关系类型有三种:
互补:两个假说分别解释了不同层面的事实,可以兼容。银行坏账假说解释信贷供给端,资产负债表衰退假说解释需求端。两者可以同时成立。
互斥:两个假说对同一个事实给出了矛盾的解释。如果你同时接受两者,逻辑上就会出问题。
包含:一个假说是另一个假说的子集或推论。通缩预期可能是需求不足的结果,而不是独立原因。
画一张关系图:把所有假说放在纸上,用箭头标出互补、互斥和包含关系。这张图比任何单一假说的分析都有价值。
如果发现所有假说的解释力加总远超100%,说明存在严重共线性。假说之间有大量重叠。这时候需要做因子合并——把高度相关的假说合成一组,再重新评估。
区分主因、放大器和被误认为原因的结果
经过正反测试和关系分析,现在可以给每个假说分配角色。
主因:在时间线上先于停滞出现、逻辑上能独立引发停滞、去除后停滞应该缓解的因素。
放大器:停滞开始后加深或延长了停滞,但单独不足以引发停滞的因素。人口变化在日本更像放大器。
结果被误认为原因:停滞本身产生的现象,被倒因为果。通缩可能是停滞的结果而不是原因,通缩预期则可能既是结果又是放大器。
这三类不是泾渭分明的。一个因素可能在早期是结果,在中后期转变为放大器。关键是标清它在不同阶段的角色。
判断标准:
- 时间线优先:先于停滞出现的候选因素更可能是主因
- 反事实检验:如果这个因素不存在,停滞是否仍会发生?如果是,它更可能是放大器
- 因果方向:这个因素是导致了停滞的某种表现,还是被停滞导致?
把判断落成一张综合图
检验的终点不是找到"唯一正确答案"。终点是画出一张因果地图:哪些因素是主因,哪些是放大器,哪些是结果。它们之间怎么互相作用。
这张地图应该能回答三个问题:
如果只能干预一个因素,应该优先干预哪个?为什么?
如果目前的政策只在针对放大器而不是主因,效果为什么有限?
如果有人用这个经济体类比另一个经济体,哪些条件匹配、哪些不匹配?
一张诚实的因果地图一定有空白区域——某些环节的证据还不够,某些因果方向还有争议。空白不是缺陷,而是诚实的边界。
一页检验清单
- 候选假说是否已经穷尽(不少于四个独立假说)
- 每个假说是否做了正反测试
- 反对证据涉及核心预测还是边缘预测
- 假说之间的关系是否画清(互补、互斥、包含)
- 解释力加总是否明显超过100%(共线性检查)
- 每个因素是否标清了角色(主因、放大器、结果)
- 时间线是否对齐
- 反事实检验是否做过
- 综合判断是否能回答"优先干预什么""为什么当前政策效果有限"
- 因果地图是否标出了空白区域