因果分析系列5--因果分析中的偏差
- 1.混杂偏差
- 2.选择偏差
- 小结
在上一节中,介绍了现实中常见的三种因果图结构:
链结构(chain)A->B->C;
叉结构(fork)A<-B->C;
对撞结构(collider)A->B<-C。
不管多复杂的结构都可拆解为其中的一种或某几种。基于三种常见的结构有助于我们分别探索三种可能导致的偏差。其中链结构对应选择偏差,叉结构对应混杂偏差,对撞结构对应选择偏差。具体介绍如下所示
常见的因果分析偏差主要包含:混杂偏差和选择性偏差。我们将所有变量分为三类:处理变量T,结果变量Y,协变量X。当X同时是T和Y的原因,即叉结构时,若不控制将会产生混杂偏差,X称为混杂因子。当T和Y同时是X的原因,即对撞结构(collider)时,将会产生选择偏差。下面将分别对混杂偏差和选择偏差进行讨论。