自变量/解释变量/因变量/响应变量/协变量等变量相关概念探析

article/2025/11/10 13:41:18

概念探析

一般科学实验主要涉及以下三种变量:

自变量/独立变量(independent variable):自变量是指在实验中由实验者操作的变量,它被认为不会受其他变量的影响(即独立性)。

因变量(dependent variable):因变量是指随着自变量的变化而变化的变量。

控制变量(control/controlled variable / fixed variable):控制变量是指实验中除自变量以外的影响实验变化和结果的潜在因素或条件,且在实验中一般需要控制其不变。也称无关变量( extraneous variable),多见于心理学实验。

例如经典初中生物实验“光对鼠妇生活的影响”,考虑自变量“光”,因变量为“鼠妇的分布”,控制变量为“土壤湿度”和“温度”,通过实验者操作来改变自变量“光”(在实验中由实验者操作的变量),同时保持控制变量“土壤湿度”和“温度”不变(除自变量以外的影响实验变化和结果的潜在因素或条件),即可探究“光对鼠妇生活的影响”。

再复杂一些,一些实验中可能包含了一些不由实验者控制或实验者不想考虑的、但其与因变量甚至自变量都相关,有可能歪曲(掩盖或夸大)自因素与因变量之间真正联系的变量,我们称其为混杂变量或混杂因素(confounder、confound、confounding variable)。通常不将其视为控制变量。而为了尽可能降低其对实验的影响,通常就需要借助统计学中的一些方法了(如倾向得分匹配(PSM)等)。

混杂变量(混杂因素):混杂因子亦叫混杂因素或外来因素(confounder、confound、confounding variable),是指与研究因素(暴露因子)和研究疾病(结局因子)均有关、若在比较的人群组中分布不匀,可以歪曲(掩盖或夸大)研究因素与疾病之间真正联系的因素。

在这里插入图片描述

我们还会经常性地遇到协变量(covariate)这个称呼:

协变量:指实验中除自变量以外的影响实验变化和结果的潜在因素或条件,但并非实验所感兴趣的变量。

可以认为,控制变量和混杂变量都包含在协变量的范畴中。

统计学中有一个类似的分类,将变量分为解释变量(explanatory variable)、响应变量(response variable)与协变量。自变量和解释变量都是实验中实验者关注的那部分变量,区别仅仅在于解释变量未必是独立的,也不一定能由实验者进行控制。

在这里插入图片描述

在经济学和回归问题中,其实还有个类似的概念,外生性变量(exogenous variable)和内生性变量(endogenous variable):

A variable x_j is said to be endogenous within the causal model M if its value is determined or influenced by one or more of the independent variables X (excluding itself).

可以看出,虽然概念类似,但是内生性变量和外生性变量是观测一个因果系统的时对变量内生性/外生性做出的描述,在一个因果系统内,内生性变量受到系统内外生性变量的影响,外生性变量则完全由外部条件决定。因此从稍微宏观点的角度看,对整个因果系统来讲,协变量可以是内生性变量也可以是外生性变量。

实际应用

而在计算机领域、统计学中研究的回归问题中,却通常不刻意区分自变量/解释变量/协变量,他们都可以被输入到自变量中,例如使用SPSS进行自回归分析:

在这里插入图片描述

只要认为有必要,大可将协变量输入到自变量栏目中。

复杂系统中,使用基于神经网络的回归模型对某些目标变量进行多变量回归,也可弱化对自变量/解释变量/协变量的区分,都将其输入,统称为协变量或变量。

参考文献

https://www.xiahepublishing.com/2475-7543/MRP-2017-005

https://stats.stackexchange.com/questions/395517/what-is-the-difference-between-covariate-and-confounding-variables

https://bbs.pinggu.org/thread-4995555-1-1.html

https://www.statology.org/covariate/

https://www.zhihu.com/question/278428717

https://spss.mairuan.com/jiqiao/spss-genn.html

http://www-personal.umd.umich.edu/~delittle/Encyclopedia entries/Endogenous variable.htm

https://www.statisticshowto.com/endogenous-variable/

https://www.jianshu.com/p/863ece6e7f3a


http://chatgpt.dhexx.cn/article/dEIuyUdL.shtml

相关文章

爬虫-猫眼电影票房

背景 最近也不知道咋了,一直遇到 字体反爬手段,起点中文网,抖音等等吧,猫眼我一直想搞,只是没有精力了,前面搞了2个了,不差这一个。搞完这个,不在搞字体反爬了。 目标网站 猫眼票房…

python爬虫实例——中国电影票房

刚好最近在做一个关于中国电影市场的分析,所以这篇实例就诞生啦!!! 一、观察网页 我所爬取的网站是:中国票房——年度票房。 网址甩出来:http://www.cbooo.cn/year?year2019 我们需要的数据是从2015年到…

python爬虫实战——猫眼电影案例

python爬虫实战——猫眼电影案例 背景 笔者上一篇文章《基于猫眼票房数据的可视化分析》中爬取了猫眼实时票房数据,用于展示近三年电影票房概况。由于数据中缺少导演/演员/编剧阵容等信息,所以爬取猫眼电影数据进行补充。关于爬虫的教学内容&#xff0c…

猫眼app产品分析和原型绘制

本项目为学习产品知识和技能过程中的一个小结,针对猫眼电影app的简单产品分析,顺便巩固xmind和axure技能。 项目名称 :猫眼电影app 产品背景:中国电影市场近10年(2009年-2019年)由高速增长阶段过渡到低速增…

Python爬虫实战+数据分析+数据可视化(猫眼电影)

一、爬虫部分 爬虫说明: 1、本爬虫是以面向对象的方式进行代码架构的 2、本爬虫爬取的数据存入到MongoDB数据库中 3、爬虫代码中有详细注释 代码展示 import re import timefrom pymongo import MongoClient import requests from lxml import html from urllib …

python爬虫基础案例——爬取猫眼电影并保存数据到excel

好久没更新博文了,最近忙于学习scrapy框架和微信小程序开发,今天看到一个自己之前写的但是中途放弃的爬虫小案例——爬取猫眼电影TOP100榜的相关数据,现在将它写好并分享给大家。 爬虫的套路就是通过url发送请求,获取数据&#x…

采集电影票房实时数据

网址:aHR0cDovL3BmLmZlLnN0Lm1hb3lhbi5jb20vZGFzaGJvYXJk 抓包分析 根据数据包可以发现,该网站在发送了ajax请求的同时又请求了一份woff文件,基本上可以确定这里使用了字体文件加密的方式了。 分析请求参数 不难看出,只有timestam…

【Python爬虫】猫眼电影榜单Top100

这是一个入门级的Python爬虫,结构易于理解。本文对编写此爬虫的全过程进行了讲述。希望对大家的Python爬虫学习有所帮助。 一、目标 爬取猫眼电影榜单Top100,将数据存入Excel文件中,并利用pyecharts库进行数据可视化得到.html文件和.png文件…

python爬虫阶段性总结和项目实操——爬取猫眼票房Top100

本博客通过爬取猫眼票房Top100来简要复习一下网页的HTML获取(requests库)解析(Beautiful Soup库)和数据保存(csv库)以及总结一下爬取过程中遇到的问题和解决方法 运行结果如下 1.获取网页源代码 def get_…

猫眼产品分析

一、前言 本文试图通过对猫眼电影的版本迭代历程分析、用户分析、功能分析、运营分析以及数据表现来回答以下几个问题: (1)猫眼电影的产品定位? (2)猫眼电影产品设计及运营中有哪些亮点和策略&#xff1f…

详解用爬虫批量抓取猫眼电影票房数据

"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 "大数据"首先是指数据体量(volumes)大,指代大型数据集,一般在10TB规模左右&#xf…

基于Python的电影票房爬取与可视化系统的设计与实现

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

猫眼 — 破解数字反爬获取实时票房

From:https://zhuanlan.zhihu.com/p/33112359 js分析 猫_眼_电_影 字体文件 font-face:https://www.cnblogs.com/my8100/p/js_maoyandianying.html 解析某电影和某招聘网站的web-font自定义字体:https://www.jianshu.com/p/5400bbc8b634 Font…

猫眼电影票房爬取到MySQL中_爬取猫眼电影top100,request、beautifulsoup运用

这是第三篇爬虫实战,运用request请求,beautifulsoup解析,mysql储存。 如果你正在学习爬虫,本文是比较好的选择,建议在学习的时候打开猫眼电影top100进行标签的选择,具体分析步骤就省略啦,具体的…

python 抢票代码 猫眼演出_Python爬虫-猫眼电影排行

爬虫的目标 爬取猫眼电影TOP100的电影名称,时间,评分,图片等信息 抓取分析 查看网页源代码,找到对应的目标信息,发现一部电影对应的源代码是一个dd节点 抓取首页 为了方便,这里先抓取第一页的内容,运行之后,可以查看到网页的源代码,之后需要对页面进行解析。 import re…

flask+猫眼电影票房预测和电影推荐

flask猫眼电影票房预测和电影推荐,此系统有详细的录屏,下面只是部分截图,需要看完整录屏联系博主 系统开发语言python,框架为flask,数据库mysql,分为爬虫和可视化分析

猫眼电影产品分析

一、前言 本文试图通过对猫眼电影的版本迭代历程分析、用户分析、功能分析、运营分析以及数据表现来回答以下几个问题: (1)猫眼电影的产品定位? (2)猫眼电影产品设计及运营中有哪些亮点和策略? …

超过53亿!《长津湖》为什么这么火爆?我用 Python 来分析猫眼影评

对于这个十一黄金周的电影市场,绝对是《长津湖》的天下,目前票房就已经突破53亿,大有奋起直追《战狼2》的尽头。而且口碑也是相当的高,猫眼评分高达9.5,绝对的票房口碑双丰收啊 下面我们就通过爬取猫眼的电影评论&am…

python使用pyecharts对猫眼电影票房精美可视化分析简单仪表盘??(五个图好多个组件!!)

本次带来的是象形柱状图,玫瑰饼图,柱状图,折线图,漏斗图,并在一个网页上显示。排版也不好,其实我就是翻译下文档给大家讲解一下! 我又来了!上次做了个猫眼电影的不过瘾,又…

python爬猫眼电影影评,Python系列爬虫之爬取并简单分析猫眼电影影评

前言 今天给大家介绍利用Python爬取并简单分析猫眼电影影评。让我们愉快地开始吧~ 开发工具 Python版本:3.6.4 相关模块: requests模块; pyecharts模块; jieba模块; scipy模块; wordcloud模块; …