为什么相关不等于因果

article/2025/10/13 12:16:47

为什么相关不等于因果

十九世纪末,荷兰出现了一个奇怪的现象:人口出生率与当地白鹳的数量同步增长。鹳鸟送子的传说由此而来。虽然这个故事逐渐消失在民间传说中,但现实生活中类似的相关性无处不在。二十世纪和二十一世纪的新研究一再证实,在一些欧洲国家,鹳与人口出生率在统计学上确实存在显著关联。

在这里插入图片描述

《鹳鸟送子》明信片

1958年,伦敦政经学院教授威廉·菲利普斯(William Phillips)发表了一篇关于失业与通货膨胀之间联系的论文。人们从菲利普斯教授的数据中惊奇地发现:高通胀与低失业率有关,反之亦是如此。如此一来政策制定就变得非常明确。国民经济只需要在通货膨胀和失业之间做出选择,或者以某种方式在二者之间找到平衡。后来,这种联系被称作“菲利普斯曲线”,多年来为欧洲和美国的宏观经济政策决策提供帮助。

在这里插入图片描述

菲利普斯曲线

人类天生喜欢识别模式。我们在大学上花费大量学费,是因为教育水平与毕业后的收入相关。我们被新鲜出炉的饼干所散发出的扑鼻香气所吸引,是因为香气的浓度与饼干的新鲜程度有关。我们早睡,是因为一夜好眠能带来第二天神清气爽。我们避免睡前吃奶酪,是因为奶酪消费量与床单绞杀事故有关。

等等,奶酪那条是什么鬼?

模式很明显:全国(美国)奶酪消费量的增长与被床单绞杀窒息而死的人数增长之间存在统计相关性。有下图为证:

数据源: U.S. Department of Agriculture 和 Centers for Disease Control & Prevention

可能是融化的奶酪堵塞了呼吸道,也可能是奶酪会导致睡梦惊厥。或者可能这种相关性根本就是虚假的,完全是个偶然。我们几乎可以肯定上面的相关性是虚假的。相关性是否意味着因果关系?上面的例子就很直观 – 相关并不总是蕴含因果,很多相关性是虚假的

相关性作为一个概念,意味着两个事物一起变化。炎热的天气与冰淇淋的销量相关。阴霾的天空与下雨有关。但还有这个:尼古拉斯·凯奇每年出演的电影数量与掉落泳池淹死的人数相关。

数据源: Centers for Disease Control & Prevention 和 Internet Movie Database

相关性并不总是有意义的

还记得出生率与鹳之间的相关性吗?这也是巧合。对这种现象的现代研究是为了证明统计数据使用不当可以轻而易举地产生错误结论。事实证明,威廉·菲利普斯(William Phillips)的经济学理论也站不住脚。通货膨胀与就业的联系是普遍存在的,但它过于简单化。多年后,新的研究表明,菲利普斯的模式与长期数据不符。尽管二者有关联,但并不直接控制彼此。


只要有足够多的数据,就有可能找到相关的事物,即便他们之间毫无联系。这种方法通常被称为“数据疏浚”。数据疏浚是一个数据挖掘技术,它将一个变量与其他大量变量相比较,来寻找数据间可能的关系。一般科学家会首先假设两个变量之间存在某个关系,然后通过分析数据确认这种关系存在的显著程度,根据显著程度接受或拒绝最开始做出的假设。例如,通过将鹳与出生率相关联来测试鹳是否带来婴儿的理论。

计算机程序不是测试单个假设,而是可以通过简单地将每个数据集与其他数据集进行比较来进行数据疏浚。进入二十一世纪,技术进步和数据收集让这项工作变得更加容易。今天我不必租来尼古拉斯·凯奇的所有电影光盘逐个阅读发行日期,只需要在IMDb.com上动动手指,2分钟内就能找到尼古拉斯·凯奇参演的所有电影。我想了解特定疾病的死亡率,疾病控制中心会公布其所有数据;我想知道有多少全职爸爸,人口普查会或国家统计局会给我一个可靠的估计。这就是大数据和大相关性的时代。


接下来的内容中,你将看到完全没有因果关系的数据集之间产生的数十种相关性。每个相关性都是由计算机发现的。这些虚假的相关性也许会让你忍俊不禁,但本文更希望在你会心一笑之后能够严肃地思考相关性和因果之间的关系–图表也会说谎,并非所有的相关性都蕴含因果关系。相关性是科学分析的重要组成部分,但如果使用不当,会带来很多误导。更可怕的是还有人会对图表巧妙包装,将图表设计的更具欺骗性。
∗ ∗ ∗ \ast \ast \ast

01

数据来源: U.S. Office of Management 和 Budget 和 Centers for Disease Control & Prevention


02

数据来源: National Vital Statistics Reports 和 U.S. Department of Agriculture


03

数据来源: National Spelling Bee 和 Centers for Disease Control & Prevention


04

数据源: National Science Foundation 和 Dept. of Energy


05

数据源: U.S. Bureau of Transportation Statistics 和 Centers for Disease Control & Prevention


06

数据源: Centers for Disease Control & Prevention 和 Dept. of Energy


07

数据源: U.S. Department of Agriculture 和 Dept. of Energy


08

数据源: Dept. of Energy 和 Centers for Disease Control & Prevention


09

数据源: Centers for Disease Control & Prevention 和 National Vital Statistics Reports


10

数据源: U.S. Department of Agriculture 和 National Science Foundation


11

数据源: Federal Aviation Administration 和 National Science Foundation


12

数据源: U.S. Census Bureau 和 National Science Foundation


13

数据源: Wikipedia 和 Centers for Disease Control & Prevention


14

数据源: U.S. Department of Agriculture 和 Centers for Disease Control & Prevention


15

数据源: Centers for Disease Control & Prevention 和 Internet Movie Database



http://chatgpt.dhexx.cn/article/ThydLkoq.shtml

相关文章

独立正交不相关定义关系

一、“独立”、“不相关”和“正交”的定义 假设X为一个随机过程,则在t1和t2时刻的随机变量的相关定义如下(两个随机过程一样): (1)定义Rx(t1,t2)E{X(t1&…

不相关、独立、正交的区别与联系

1.相关定义说明: 随机过程:X(t)和Y(t)互相关函数:Rxy(t1,t2)E{X(t1)Y(t2)}互协方差函数:Cxy(t1,t2)E{[X&…

不独立 ≠ 不相关 (Independent ≠ Uncorrelated)

在数学期望的性质里有一个性质:随机变量X和Y相互独立,有:E(XY) E(X)E(Y). 事实上这里成立的充要条件是X和Y不相关即可。 那么问,相互独立与不相关的关系是什么呢? 独立性是指两个变量的发生概率一点关系没有;而相关…

View For EasyUI 后台模板html

ViewUI For EasyUI View For EasyUi是基于EasyUI-1.5x开发的前端UI框架主题皮肤,包含所有EasyUI的全部组件美化, 还有各种插件,各种优化 ,完全使用矢量图标,每一个小图标都是矢量图标,支持无限放大和颜色设…

easyui了解

目录 一、框架概述 1、什么是Easyui? 2、EasyUI的常用组件 3、EasyUI的特点 缺点 使用: 4、EasyUI的目录说明 4.1 下载路径 4.2 必须的基础支持库 4.3 目录说明 二、WEB项目搭建EasyUI环境 1.EasyUI入门示例 1.1 标准开发步骤 1.2 代码模板 …

JQuery EasyUI-1.5.x-Of-Insdep-Theme后台模板

简介: JQuery easyui 1.5.x of Insdep Theme 1.0.0 RC2,是基于EasyUI 1.5.x 的一款免费的美化主题包,拥有百度编辑器、cropper、Highcharts、justgage、plupload等各类适应本主题的第三方插件美化补丁。并且各类常用Jquery插件正在美化中。 …

easyui自学模板代码

index.jsp源码 <% page language"java" contentType"text/html; charsetUTF-8"pageEncoding"UTF-8"%><% taglib uri"http://java.sun.com/jsp/jstl/core" prefix"c"%> <c:set var"ctx" value"…

easyui酷黑风格主题模板组件html

模板简介&#xff1a;基于easyui目前最新版本1.10.X设计制作&#xff0c;后期会随easyui版本进行响应更新。模板仅修改easyui默认的css样式文件&#xff0c;可以很方便的与默认主题进行替换或切换。对于已有项目&#xff0c;可以快速的替换主题&#xff0c;不影响系统功能。对e…

使用easyui快速搭建管理员主界面

使用easyui快速搭建管理员主界面 easyui主页&#xff1a;index.jspsidebarTree.json&#xff1a;左侧菜单内容 easyui easyui又叫Jquery EasyUI&#xff0c;是基于Jquery的界面框架插件&#xff0c;提供了丰富的界面功能&#xff0c;方便快速开发Web界面程序 目前easyui的官方网…

easyui poi 一个模板导出多个模板数据,在一个sheet中导出

easyui poi 一个模板导出多个模板数据&#xff0c;在一个sheet中导出 1.示例代码2.模拟数据3.导出模板4.导出效果 1.示例代码 /*** 导出excel表格** return excel 文件流*/ResponseExcelApiOperation(value "导出excel表格", notes "导出详情excel表格"…

easyui首页模板

Easyui首页html代码 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head><meta name"renderer" content"webkit"></meta><tit…

easyui_datagrid模板代码

<!DOCTYPE html> <html><head><meta charset"utf-8" /><title>jquery_easyui模板代码</title><link rel"stylesheet" type"text/css" href"js/jquery-easyui-1.7.0/themes/default/easyui.css"…

easyui(基础布局)

一.easyUI的简介 easyui是一款基于jQuery的前端框架&#xff0c;可以使用其中的组件进行布局以及用来做后台的管理界面。 EasyUI是一个前端开发的框架&#xff0c;其将常用的页面开发使用的组件进行了封装&#xff0c;前端开发人员只需将EasyUI的资源导入项目后使用即可&am…

jquery easyui后台模板

上一篇教程《asp.net mvcjquery easyui开发实战教程之网站后台管理系统开发3-登录模块开发》完成了本项目的登录模块&#xff0c;登录后就需要进入后台管理首页了&#xff0c;需要准备一个后台模板&#xff0c;本文主要讲解如何创建这个后台模板&#xff0c;本文创建的后台模板…

easyui-super-theme后台模板

简介&#xff1a; 基于easyui最新版1.5.1的一套皮肤&#xff0c;flat ui的配色&#xff0c;字体图标用的是fontawesome 模板使用方式&#xff1a; 皮肤是基于gray主题修改的 把dist下的super主题文件夹考到easyui/themes文件夹下面 依次引入&#xff08;跟其他easyui主题用…

抓取京东评论数据

京东&#xff0c;淘宝等的评论数据貌似无法直接在源代码中查看&#xff0c;那么如何找到对应的评论数据的源代码文件呢&#xff1f; 这里要用到chrome浏览器的审查元素功能&#xff0c;以京东为例&#xff0c;点开一个评论页面&#xff0c; 然后在chrome中选择network的scr…

京东商品评论爬取

上个月爬取京东商品评论的时候&#xff0c;突然发现爬不下来了&#xff0c;爬取后获得的HTML文本长度为0&#xff0c;状态码200&#xff1b; 1&#xff09;随便打开了一个京东的商品页面&#xff0c;按下 F12后&#xff0c;Ctrl R&#xff1b; 2&#xff09;点击商品评论&…

“梨喔喔”之后再推“芥么”,京东的“潮流”社交有多潮?

当电商行业进入到存量竞争时&#xff0c;“四路”玩家开始大显神通&#xff0c;找到差异化的竞争点&#xff0c;于是乎&#xff0c;互联网巨头纷纷瞄准了相对陌生的潮流社区。 据Tech星球独家获悉&#xff0c;近期&#xff0c;京东在微信端测试了一款名为“芥么”的小程序&…

爬取京东商品评论

大概又是个陈年旧代码放上来看看 代码github:https://github.com/imcy/doubanAnaly 包括爬豆瓣和爬京东以及主题分析 txt文档是用来写入好评和差评的’fetchJSON_comment98vv13933’ 这个可以在打开商品页面拉到评论地方后&#xff0c;Chrome浏览器右键检查network&#xff0c…

试图爬取京东中差评

京东两个商品的中差评爬下来&#xff0c;因为评价太多了总共1万评价爬虫软件最多爬到前1000条&#xff0c;所以全是好评&#xff0c;但是想要分析的是中差评数据 商品链接 https://item.jd.com/100013315046.html https://item.jd.com/100011977026.html#none 一、visual s…