R语言实现双变量分析教程

article/2025/8/14 15:46:25

双变量分析表示分析两个变量。

双变量分析是为了分析两个变量之间的关系,与单变量、多变量分析对应。主要有三种方式进行双变量分析。

  1. 散点图
  2. 相关系数
  3. 简单线性回归

下面使用测试数据作为示例来演示三种方法,供包括两个变量,HourStudied表示学习时间,ExamScore为测试成绩。

exData <- read.csv("csv/exData.csv")
exData#    HourStudied ExamScore
# 1            1        75
# 2            1        66
# 3            1        68
# 4            2        74
# 5            2        78
# 6            2        72
# 7            3        85
# 8            3        82
# 9            3        90
# 10           3        82
# 11           3        80
# 12           4        88
# 13           4        85
# 14           5        90
# 15           5        92
# 16           6        94
# 17           6        94
# 18           6        88
# 19           7        91
# 20           8        96

散点图

散点图以可视化方式进行双变量分析,其中一个变量作为x轴变量,另一个作为y轴变量。下面示例对上面示例数据画散点图:

plot(exData$HourStudied, exData$ExamScore, main = "HourStudied vs. ExamScore", xlab = "HourStudied", ylab = "ExamScore" )# 增加拟合线
abline(lm(ExamScore~HourStudied, exData))

在这里插入图片描述

通过散点图可以清晰看到两个变量之间有正相关关系,即随着学习时间增加,考试成绩也响应增加。

相关系数

相关系数是另一个双变量分析的方法。最常用的计算方法为皮尔逊相关系数,用于衡量两个变量之间的线性关系,它的值在1~-1之间:

  • -1 表示完全负相关
  • 0 表示完全没有线性关系
  • 1 表示完全正相关

这个简单指标让我们很好地了解两个变量之间的关系。在实践中经常同时使用散点图和相关系数来理解两个变量之间的关系,从而可以形象化和量化它们之间的关系。

下面代码计算示例数据的相关系数:

cor(exData$HourStudied, exData$ExamScore)
# 0.891306

返回值为0.89 表示具有较强的正相关关系。

简单线性回归

第三种方法是简单线性回归。首先选择一个变量作为解释变量,另一个作为响应变量。然后我们发现最佳直线拟合数据集,使用该线性模型可以进行预测。

下面代码执行简单线性回归:

model <- lm(ExamScore~HourStudied, exData)
summary(model)# Call:
# lm(formula = ExamScore ~ HourStudied, data = exData)
# 
# Residuals:
#    Min     1Q Median     3Q    Max 
# -6.920 -3.927  1.309  1.903  9.385 
# 
# Coefficients:
#             Estimate Std. Error t value Pr(>|t|)    
# (Intercept)  69.0734     1.9651   35.15  < 2e-16 ***
# HourStudied   3.8471     0.4613    8.34 1.35e-07 ***
# ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
# 
# Residual standard error: 4.171 on 18 degrees of freedom
# Multiple R-squared:  0.7944,	Adjusted R-squared:  0.783 
# F-statistic: 69.56 on 1 and 18 DF,  p-value: 1.347e-07

通过输出可以看到回归模型为:

  • Exam score = 69.07 + 3.85*(hours studied)

可解释为:每增加学习时间1小时,平均增加成绩3.85分。通过线性回归模型,我们可以量化两个变量之间的关系。

总结

双变量分析是统计学中最常用的分析类型之一,因为我们经常对理解两个变量之间的关系感兴趣。通过使用散点图、相关系数和简单线性回归,我们可以可视化和量化两个变量之间的关系。

通常这三种方法在分析中需同时使用,以全面了解两个变量之间的关系,因此同时熟悉三种方法是不错的选择。


http://chatgpt.dhexx.cn/article/kWyD1X2m.shtml

相关文章

spss实战案例----分析多个变量与因变量之间是否存在关系,方差分析

本案例是IBM SPSS数据分析与挖掘实战案例精粹----第七章的学习记录 案例背景或目标&#xff1a;激素水平是否在对照组和实验组之间存在差异 分析方法&#xff1a;Bootstrap抽样&#xff0c;秩和检验&#xff0c;秩变换方法&#xff0c;cox回归 字段包括&#xff1a;性别&…

Python学习16 ----Seaborn多变量分析绘图

Seaborn多变量分析绘图 代码详见https://github.com/RenDong3/Python_Note 1 读取数据 2 分析绘图 parameters: x,y,hue 数据集变量 变量名data 数据集 数据集名row,col 更多分类变量进行平铺显示 变量名col_warp 每行的最高平铺数 整数estimator 在每个分类中进行矢量到标…

用SPSS进行多变量数据分析

用SPSS进行多变量数据分析 1.将所给的数据输入SPSS 22.0中文版。分别设置变量为温度&#xff0c;体重1、2、3、4&#xff1b;体重&#xff0c;温度5、10、15、20、30。 2.用SPSS进行作图&#xff08;过程略&#xff09;。 3.对数据进行多因素变量分析&#xff0c;具体操作如…

解读SPSS多元方差分析中的多因素多变量的相互影响

多元方差分析研究的是多个自变量与多个因变量的相互关系&#xff0c;也被称为多变量分析。在《怎么使用SPSS的多元方差分析法》一文中&#xff0c;我们已经详细学习了IBM SPSS Statistics多元方差分析的设置方法。 本文将会重点介绍如何解读多元方差分析的检验结果。由于多元方…

高维数据中特征筛选方法的思考总结——多变量分析筛选法

前言&#xff1a;之前的文章&#xff08;高维数据中特征筛选方法的思考总结——单变量分析筛选法&#xff09;中&#xff0c;对单变量分析筛选变量进行了初步考量&#xff0c;本文将进一步总结多变量分析筛选法。由于本文多处摘录网上的博客&#xff0c;只是进行了归纳整理&…

R语言实现单变量分析教程

单变量分析是理解单个变量的数值分布情况&#xff0c;与之相对的有双变量分析和多变量分析。 加载示例数据 因为csv文件中年收入字段有千分位分隔符&#xff0c;所以先定义转换函数。 setClass("num.with.commas") setAs("character", "num.with.co…

多变量分析绘图及分类属性绘图【知识整理】

多变量分析绘图及分类属性绘图 综述代码模块多指标离散图绘制盒图violin图条形图点图多层面板分类图factorplot()详细说明 小结 综述 学生党整理一些关于数据分析的知识&#xff1a;整理了多变量分析绘图及分类属性绘图的相关代码。主要包括了多指标离散图的绘制、盒图的绘制、…

python多变量相关性分析_多变量相关性分析(一个因变量与多个自变量)

目录:前言 偏相关或复相关 意义与用途 分析方法: 1、 样本相关系数矩阵、相关系数检验 2、 复相关分析 3、 决定系数 (RMSE的介绍) 小结 一、前言: 继上一篇文章,继续探讨相关性分析,这次不再是两个变量,而是3个或者以上的变量之间的相关关系分析。 没读过上…

一文了解11个常见的多变量分析方法!

在社会科学研究中&#xff0c;主要的多变量分析方法包括多变量方差分析&#xff08;Multivariate analysis of variance&#xff0c;MANOVA&#xff09;、主成分分析&#xff08;Principal component analysis&#xff09;、因子分析&#xff08;Factor analysis&#xff09;、…

多变量分析”——数据挖掘、数据分析

I。多重对应分析 多重对应分析在超过两个以上定类变量时有时候非常有效&#xff0c;当然首先我们要理解并思考&#xff0c;如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量&#xff0c;这时候就可以用简单对应分析了。 对应分析对数据…

点赞、收藏必读文章--数据分析的多变量分析

数据探索性分析(EDA)——多(双)变量分析 0 引言 上一篇文章震惊&#xff01;Python单变量分析竟然如此简单&#xff1f; 介绍了数据分析中的单变量分析&#xff0c;但是我们在实际场景中&#xff0c;遇到的数据大多数是具有多特征、多变量的&#xff0c;因此除了对单个变量进…

“多变量分析”——数据挖掘、数据分析

I。多重对应分析 多重对应分析在超过两个以上定类变量时有时候非常有效&#xff0c;当然首先我们要理解并思考&#xff0c;如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量&#xff0c;这时候就可以用简单对应分析了。 对应分析对数据…

Open source Python toolbox for seismology

Open source Python toolbox for seismology ObsPy: A Python Toolbox for Seismology https://www.iris.edu/hq/webinar/2015/05/obspy_a_python_toolbox_for_seismology https://github.com/obspy/obspy http://www.obspy.org → https://github.com/obspy/obspy/wiki 2.用p…

Xmy的Python----Numpy库

目录 例题10-1&#xff1a;创建数组并查看数组属性 构造复杂数组 生成随机数 例题10-2&#xff1a;绘制&#xff1a;随机生成10000数据&#xff0c;服从均值为0&#xff0c;方差为1的正态分布的直方图&#xff08;间隔个数&#xff1a;50&#xff09; 通过索引访问数组 数组的…

python3.8安装pysal库

python3.8 安装 pysal 库 我最后是在虚拟环境中测试成功的&#xff0c;在原来的环境中测试还是有问题&#xff0c;但是装这个库只是为了一个assignment&#xff0c;踩完坑来总结一下&#xff0c;先用上再说。 1. 创建虚拟环境 正常环境无论是conda install 还是 conda-forge …

YYlabelCopy

YYlabelCopy 前言 最近公司刷题项目重构,之前刷题是采用富文本渲染,性能极差,业界大神ibireme的YYKit想必大家都知道,YYText的好用之处我就不再赘述.一开始我们是把UIlabel换成YYTextView,为什么不直接换成YYlabel,YYlabel支持异步绘制,因为我们是做公考项目的,试题都要支持复…

Kong Customize Python Plugin

Kong Customize Python Plugin 前情提要&#xff1a;由于公司业务需求&#xff0c;需要针对 Kong 自定义插件&#xff0c;而 Kong 的插件主要是 Lua 语言&#xff0c;公司的技术栈是 Python&#xff0c;所以升级了 Kong 版本到 3.1。Kong3.1支持使用 Python 语言的插件&#xf…

ubuntu中pip install cython_bbox报错

pip install cython_bbox报错 问题记录 pip install cython_bbox报错如下 Collecting cython_bboxUsing cached cython_bbox-0.1.3.tar.gz (41 kB)Preparing metadata (setup.py) ... errorerror: subprocess-exited-with-error python setup.py egg_info did not run succe…

Cython-bbox pip 安装报错

安装步骤 下载Cython_bbox源码&#xff0c;点击Download files下载。解压文件。打开setup.py&#xff0c;找到第31行&#xff0c;把其中extra_compile_args[’-Wno-cpp’]的替换为extra_compile_args{‘gcc’: [‘/Qstdc99’]}。保存改动&#xff0c;返回cython_bbox-0.1.3文件…

pysot-toolkit测试及对比

文章目录 前言1、环境搭建2、文件配置3、测试及对比3.1 单跟踪器测试3.2 多跟踪器对比 前言 pysot-toolkit是一款评估单目标跟踪性能的工具&#xff0c;可以计算OPE(One Pass Evaluation)下的Success和Precision、以及VOT(Visual Object Tracking)的性能指标Accuracy、Robustne…