什么是因果分析?
因果分析(Causal Analysis)是分析彼此之间的因果关系。
因果推断(Causal Inference)是基于原因推结果,是因果分析的一部分。
因果分析是数据分析、数据科学中重要的方法,广泛应用于A/B实验,异常分析,用户增长等领域。
本文尝试从宏观视角,用逻辑来推导因果分析的基础、原理、方法,应用的知识体系。
首先,介绍了因果分析的概念、要素和分类等基础知识;
接着,介绍了因果分析的A/B实验、鱼骨图分析等常见的因果分析方法的原理;
然后,介绍了A/B实验(策略调整)、异常分析(DAU下降)等因果分析方法的应用,并介绍了R、Python因果推断工具;
最后,对因果分析进行总结,指出因果分析的本质,介绍了因果关系与相关关系的区别,及发展趋势。
本文目录如下:
1. 因果分析基础
1.1. 因果分析的概念
1.2. 因果分析的要素
1.3. 因果分析的分类
2. 因果分析原理
2.1. A/B 实验的原理
2.2. 鱼骨图分析的原理
3. 因果分析应用
3.1. A/B 实验:策略调整
3.2. 异常分析:DAU下降
3.3. 因果推断工具
4. 因果分析总结
4.1. 因果分析的本质
4.2. 因果关系 VS 相关关系
4.3. 因果分析的发展趋势
接下来,让我们一起走进因果分析的世界,去尝试探讨因果分析的基础、原理、方法论和应用。
1. 因果分析基础
1.1. 因果分析的概念
因果是指原因和结果,因果关系则是原因和结果的关系。
什么是因果分析?
这里推荐知乎的一篇优秀文章:较清晰的描述了因果分析的概念:因果关系 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/555170435
因果分析是分析彼此之间的因果关系。
1.2. 因果分析的要素
原因可能是多个,导致的结果也可能是多个。
这里我们把问题聚焦,仅探讨抽象的因果关系,所以因果分析可以抽象如下:
因果分析的三要素是:原因、结果和关系。
1.3. 因果分析的分类
- 按照因果分析的三要素,把因果分析分为三类:
- 第一类:由原因推结果,又称为因果推断(Causal Inference);
- 第二类:由结果找原因;
- 第三类:原因和结果互推;
因果分析都有哪些方法?
因果分析三类典型代表方法如下表所示:
这里特别说明:因果推断(Causal Inference)是由原因推结果,又称因果推理,因果推断法,是因果分析的一类,在数据科学得到广泛应用,与机器学习结合越来越紧密。
2. 因果分析原理
互联网领域,A/B 实验、鱼骨图分析法是常用的因果分析方法,所以接下来重点阐述这两种方法的原理。
2.1. A/B 实验的原理
A/B 实验,也称 A/B 测试、A/B 试验,是一种随机对照实验,用于实验验证因果关系。
A/B 实验,是因果实验的代表,是因果归因、数据归因的主要手段。
A/B 实验是一种单因素归因,适用于验证单因素的因果关系。
2.2. 鱼骨图分析的原理
鱼骨图分析(Cause and Effect Analysis Chart,也称因果分析法)是典型的由结果找原因的方法。
鱼骨图分析法是对一个问题,分类别、穷举性地列出所有影响因素,进行进一步分析。
其中鱼头是结果(问题),大鱼骨是原因的类别,小鱼骨是具体原因。
鱼骨图分析适用于头脑风暴,寻找多个可能的原因。
3. 因果分析应用
接下来介绍一些因果分析的典型应用场景。
由原因推结果的A/B实验的应用;由结果找原因的异常分析的应用。
3.1. A/B 实验:策略调整
微软的调整页面颜色,提高点击率的A/B实验。
3.2. 异常分析:DAU下降
在异常分析中,异常是结果,找到导致异常的原因,并给出优化建议。
3.3. 因果推断工具
R、Python因果推断工具很多,比如Dowhy、Causal ML、EconML、causalToolbox等。更多因果推断工具、因果推断方法、因果推断模型可参考论文《A Survey on Causal Inference》以及关河因果产品:
新型数据分析产品_因果分析_关河因果【官网】 (grandhoo.com)https://yinguo.grandhoo.com/home
4. 因果分析总结
4.1. 因果分析的本质
因果分析的本质就是论证因果关系的充分性、必要性。
4.2. 因果关系 VS 相关关系
因果关系一定是相关关系,但相关关系不一定是因果关系。
4.3. 因果分析的发展趋势
个人觉得:
原因推结果这个方向,比如元分析(Meta-analysis)、因果推断机器学习;
结果找原因这个方向,比如破界创新。
关于破界创新的工业应用案例,可以参考《因果分析应用之破界创新:从结果到原因,再从原因到结果》。
https://zhuanlan.zhihu.com/p/539417288
参考文献:
总结:
《精益数据分析》作者认为:"发现相关性可以帮助你预测未来,而发现因果关系意味着你可以改变未来",所以重视因果关系,重视因果分析吧。
因果分析可以定位问题,挖掘商业价值,洞见机会,在互联网领域有广泛的应用,比如因果推断、A/B实验、用户增长、异常分析和流失分析等。
但是商业是个复杂生态,因果分析是个很好的分析工具,还要结合具体的用户、业务、数据进行针对性的分析。
结束语:
由于个人的经历、能力和水平是有限的,我的可能是片面的,也可能是错的,这里抛砖引玉。
由于个人的经历、能力和水平是有限的,我的可能是片面的,也可能是错的
理论本身是务虚的,需要实践、实践、再实践。可以参考阿里、快手、关河因果在因果推断上的实践。
你的反馈,正的负的都是有价值的,有助于我加速迭代升级——更深入、更全面。留下您的精彩评论吧!