R语言笔记十一:相关性分析函数及相关性检验函数

article/2025/9/27 23:14:40

1.相关性分析
       相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。简单来说就是变量之间是否有关系。
       相关性可能是正相关,也可能是负相关,需要根据相关系数决定。相关系数的大小表示相关程度的强弱。

2.相关性衡量指标
       Pearson相关系数、Spearman相关系数、Kendall相关系数、偏相关系数、多分格(polychoric)相关系数和多系列(polyserial)相关系数。

       和独立性检验不同,相关性当中每种方法都没有独立的函数,这里计算相关系数都使用同一个函数cor。cor函数可以计算三种相关系数:pearson、kendall、spearman。具体使用哪种方法,可以通过函数中的method参数指定。函数中的use参数表示如何处理缺失值,是不处理还是删除等等。

3.实例(使用数据集state.x77)

cor(state.x77)

在这里插入图片描述

       cov函数:计算协方差,衡量两个变量的总体误差,在计算偏相关的时候需要用到协方差的结果。

cov(state.x77)

在这里插入图片描述


       如果只想计算一组变量与另一组变量之间的关系,而不想将两两变量之间都计算一次,cor函数也可以很方便的实现。

x <- state.x77[,c(1,2,3,6)]
y <- state.x77[,c(4,5)]
cor(x,y)

在这里插入图片描述
4.描述相关性的其他指标,例如偏相关系数、多分格相关系数和多系列相关系数等等,可以通过R的扩展包来实现。

ggm包中的pcor可以用来计算偏相关系数。偏相关是指在控制一个或多个变量时,剩余其他变量之间的相互关系。

pcor(u,s) #u是一个向量,向量中的前两个值是要计算的相关系数的下标,其余数值为条件变量的下标;s是cov函数计算出来的协方差结果。

library(ggm)
colnames(state.x77)
pcor(c(1,5,2,3,6),cov(state.x77))

结果输出0.3462724。

5.相关性检验函数
cor.test(x,y,alternative,method)
      - x,y表示向量;
      - alternative指定单侧检验还是双侧检验,two.sided同时检验正负相关,greater检验正相关,less检验负相关;
      - method指定使用哪种相关性衡量指标(pearson、kendall还是spearman)


计算state.x77中谋杀率与文盲率之间的相关性:

cor.test(state.x77[,3],state.x77[,5])

在这里插入图片描述
解析:p-value值远小于0.05,说明谋杀率与文盲率相关,此外还给出了相关系数为0.7029752,置信区间为0.5279280~0.8207295。

置信区间:confidence interval,是指样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度。


psych包中的corr.test函数:可以一次性检验多个变量之间的相关性。
library(psych)
corr.test(state.x77)


ggm包中的pcor.test函数:检验偏相关性。
pcor.test(x,q,n)
      - x是pcor计算的偏相关系数;
      - q是要控制的变量数;
      - n是样本数。

x <- pcor(c(1,5,2,3,6),cov(state.x77))
pcor.test(x,3,50)

在这里插入图片描述


6.分组数据的相关性检验
       使用t检验,即student’s t-test,t检验是用t分布理论推论差异发生的概率,从而比较两个平均数的差异是否显著。主要用于样本含量较小,一般小于30个,总体标准差未知的正态分布数据。
(使用MASS包中的UScrime数据集举例)

t.test(Prob~So,data=UScrime)

在这里插入图片描述
解析:结果p-value值小于0.05,因此可以拒绝南方各州与非南方各州拥有相同监禁概率的假设。


       如果想在多于两个组之间进行比较,若数据满足正态分布,可以使用方差分析;若不满足正态分布,则需要使用非参数检验方法。
       非参数检验称为nonparametric tests,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
       参数检验称为parametric tests,是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。也就是数据分布已知,比如满足正态分布。


http://chatgpt.dhexx.cn/article/cok6lDE7.shtml

相关文章

数据特征分析之 python相关性检验(转载学习)

数据特征分析技能—— 相关性检验 相关性分析是指对两个或多个具备相关性的变量元素进行分析&#xff0c;从而衡量两个变量因素的相关密切程度 一般常用四种方法&#xff1a; - 画图判断 - pearson&#xff08;皮尔逊&#xff09;相关系数 - sperman&#xff08;斯皮尔曼&a…

相关性检验(二维列联表相关 协方差 Pearson相关 Spearman相关 相关性检验 相关可视化)

文章目录 相关二维列联表相关协方差Pearson相关Spearman相关相关性检验相关可视化 相关 二维列联表相关 data <- xtabs(~TreatmentImproved, data Arthritis) ## 生成二维列联表assocstats(data)协方差 states <- state.x77[,1:6] cov(states)Pearson相关 cor(state…

python实现Kendall相关性检验

python实现Kendall相关性检验 肯德尔相关性系数,又称肯德尔秩相关系数,它也是一种秩相关系数,不过它所计算的对象是分类变量。 分类变量可以理解成有类别的变量,可以分为 无序的,比如性别(男、女)、血型(A、B、O、AB); 有序的,比如肥胖等级(重度肥胖,中度肥…

R语言:相关性分析检验

相关性分析 相关性分析的检验衡量指标包括&#xff1a;Pearson相关系数、Spearman相关系数、Kendall相关系数、偏相关系数、多分格相关系数、多系列相关系数 默认使用Pearson相关系数 cor(data) #或者 cor(x,y,method c(“pearson”, “kendall”, “spearman”)) #x,y可以是…

python实现spearman相关性检验

python实现spearman相关性检验 Spearman秩相关系数 对原始变量的分布不做要求,适用范围较Pearson相关系数广,即使是等级资料,也可适用。但其属于非参数方法,检验效能较Pearson系数低。(适合含有等级变量或者全部是等级变量的相关性分析) 测试两个样本是否具有单调关系。…

多元数据的相关性检验——基于R

多元数据的相关性检验 检验方法&#xff1a;1.Pearson相关检验2.Spearman相关检验3.Kendall相关检验 cor.test函数案例分析&#xff1a; 对于多元数据&#xff0c;讨论变量间是否具有相关关系是很重要的&#xff0c;这里介绍三种相关检验—— Pearson相关检验&#xff0c;Spear…

时间序列之间的相关性检测

为了检测时间序列的相关性&#xff0c;我们经常使用自相关&#xff0c;互相关或归一化互相关。 互相关&#xff08;Cross-Correlation&#xff09; 互相关是两个不同时间序列的比较&#xff0c;以检测具有相同最大值和最小值的指标之间是否存在相关性。例如&#xff1a;“两个…

python实现pearson相关性检验

python实现pearson相关性检验 两个变量之间的相关性可以采用Pearson或Spearman相关分析方法进行分析。Pearson相关分析主要用来分析正态分布、非等间距测度的连续变量,而Spearman可用来分析不服从双变量正态分布或总体分布型未知以及原始数据是等级资料的数据。 测试两个样本是…

数据特征分析技能—— 相关性检验

数据特征分析技能—— 相关性检验 相关性分析是指对两个或多个具备相关性的变量元素进行分析&#xff0c;从而衡量两个变量因素的相关密切程度 一般常用四种方法&#xff1a; - 画图判断 - pearson&#xff08;皮尔逊&#xff09;相关系数 - sperman&#xff08;斯皮尔曼&a…

【相关性检验】

两个变量之间的相关性检验 1、皮尔森相关系数&#xff1a;它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX, σY)。 要判断两个变量之间是否存在相关性&#xff1a;可以采用画散点图的方式&#xff0c;进行直观性的分析。使用python进行person检验 import pandas as p…

数学建模竞赛知识点汇总(四)——相关性检验

数学建模竞赛知识点汇总&#xff08;四&#xff09;——相关性检验 文章目录 数学建模竞赛知识点汇总&#xff08;四&#xff09;——相关性检验简介皮尔逊相关系数总体person相关系数样本person相关系数皮尔逊相关系数假设检验前提步骤流程 斯皮尔曼相关系数皮尔逊相关系数与斯…

scanf函数使用方法详解

scanf函数使用方法详解 一.scanf函数是什么&#xff1f;二.scanf函数的作用三.注意事项1.输入数据2.%c 四.字段宽度五.scanf函数的返回值 一.scanf函数是什么&#xff1f; 1.首先我们需要知道&#xff0c;scanf函数是一种格式化输入函数&#xff08;按照格式字符串的格式&…

scanf与scanf_s函数的使用 详解

1.scanf_s(是vs提供的函数&#xff09; a.代码1 int main() {char a 0;//scanf_s("%c", &a, 1);scanf_s("%c", &a, sizeof(a));return 0; } scanf_s有三个参数&#xff0c;最后一个是变量a所占据空间的大小&#xff08;单位为字节&#xff09;&…

【opencv4】opencv视频教程 C++(opencv教程)1、opencv介绍和环境搭建

下一讲&#xff1a;【opencv4】opencv视频教程 C&#xff08;opencv教程&#xff09;2、加载&#xff0c;修改&#xff0c;保存图像 [opencv_C] 入门强推&#xff01;&#xff01;&#xff01;【B站最全】 文章目录 opencv介绍和环境搭建opencv组成架构核心模块环境搭建&#…

Opencv的使用教程,opencv比较全的基础教程

*免责声明: 1\此方法仅提供参考 2\搬了其他博主的操作方法,以贴上路径. 3* 场景一:Opencv对图像视频的基本使用 场景二:Opencv对图像视频进一步处理 场景三:Opencv对图像视频高级处理 . . . 课程视频 课程视频2 ubuntu18下采用源码编译的方式安裝opencv / 简单方式安装 …

VC2015搭建OpenCV环境(超详细教程)

1、首先下载OpenCV源码库 ① https://sourceforge.net/projects/opencvlibrary/?sourcetyp_redirect ②双击运行.exe文件&#xff0c;导出源代码 2、windows环境变量设置&#xff08;测试环境是win7 64位&#xff09; ①找到系统高级设置path 右键计算机--》属性--》高级系…

OpenMV IDE安装使用教程

一、什么是OpenMV OpenMV是一个开源&#xff0c;低成本&#xff0c;功能强大的机器视觉模块。以STM32F427CPU为核心&#xff0c;集成了OV7725摄像头芯片&#xff0c;在小巧的硬件模块上&#xff0c;用C语言高效地实现了核心机器视觉算法&#xff0c;提供Python编程接口。使用者…

OpenMV使用技巧

目录 一、光照影响1. 光照过强2. 光照过弱 二、杂框影响1. threshold参数2. 长宽比 三、画图 一、光照影响 OpenMV在使用过程中可能会遇到光照太强或者光照太弱等影响图像识别的情况&#xff0c;尤其在跑神经网络模型时&#xff0c;光照太强或太弱对识别结果的影响是致命的。 …

VC++6.0配置opencv1.0教程(全网最详细)附加图文

VC6.0配置opencv1.0教程&#xff08;全网最详细&#xff09;附加图文 &#xff08;&#xff08;很多评论我没时间看&#xff0c;tiquma写出来了&#xff0c;有兴趣的同学自己找一找8&#xff09; 配置前 第一次写博客&#xff0c;激动٩(๑>◡<๑)۶&#xff0c;坐标武…

C/C++ vs2017 OpenCV简单入门

离职之际&#xff0c;自学一下图像相关的知识点&#xff0c;只是简单学了一点皮毛&#xff01; 目录 一、 OpenCV环境搭建 二、使用opencv 常用接口说明 使用案例 1. 图像色彩空间转换 2. Mat对象的创建与赋值 3. 图像像素的读写操作 4. 图像像素的算术操作 5. 滚动条…