pandas.DataFrame.corr求解变量列相关系数与可视化展示

article/2025/10/8 6:23:47

pandas.DataFrame.corr求解变量列相关系数与可视化展示

目录

    • pandas.DataFrame.corr求解变量列相关系数与可视化展示
  • 1常见的三种相关系数
  • 2 pandas.DataFrame.corr用法
  • 3 结果可视化

1常见的三种相关系数

  • Pearson相关系数:度量两变量之间的线性相关性;对异常值敏感且对变量数据分布有要求。
  • Spearman秩相关系数:非参数统计方法,利用数据秩计算相关系数,对变量数据分布没有要求,具有稳健性。
  • Kendall秩相关系数:适用于两个变量均为有序分类的情况,构造的思想为协同思想。
    具体可以参考:统计学习–三种常见的相关系数

2 pandas.DataFrame.corr用法

DataFrame.corr(method=‘pearson’, min_periods=1)[source]

  • 数据框.corr方法将会计算数据框每个列两两之间的相似度,返回相关系数矩阵,类型为数据框。
  • Series.corr(other Series) 则返回指定的两列之间的相关系数。具体例子如下:
import numpy as np
import pandas as pd
import seaborn as sns
%config InlineBackend.figure_format = 'svg'#导入数据
df=pd.read_csv('D:/pylearn/data/iris.csv')#删除分类变量
df1=df.drop('variety',1)
print('相关系数矩阵为:\n',df1.corr())
print('sepal_length与sepal_width的相关系数为:\n',df1['sepal_length'].corr(df1['sepal_width']))

运行结果:

#相关系数矩阵为:sepal_length  sepal_width  petal_length  petal_width
sepal_length      1.000000    -0.117570      0.871754     0.817941
sepal_width      -0.117570     1.000000     -0.428440    -0.366126
petal_length      0.871754    -0.428440      1.000000     0.962865
petal_width       0.817941    -0.366126      0.962865     1.000000
sepal_length与sepal_width的相关系数为:-0.11756978413300198

3 结果可视化

#可视化
plt.figure()
sns.heatmap(df1.corr(),annot=True, vmax=1, square=True,cmap='gist_heat')
plt.show()

运行结果:
在这里插入图片描述
注:以上数据来自python自带数据,实际需要结合业务分析数据。
参考资料:
1.统计学习–三种常见的相关系数
2.python分析多个特征的相关性并绘制热力图
3.pandas.DataFrame.corr


http://chatgpt.dhexx.cn/article/04rYGlHm.shtml

相关文章

【20220623】【信号处理】深入理解Pearson相关系数和Matlab corr()、corrcoef()仿真

目录 一、定义 二、特性 三、适用条件 四、Matlab 仿真 1. 时间序列 2. 矩阵 一、定义 相关系数(correlation of coefficient)是统计学中的概念,是由统计学家卡尔皮尔逊设计的一个统计指标,也称作 Pearson 相关系数。相关系…

python计算两组数据的相关性_关于python:使用.corr获取两列之间的相关性

我有以下熊猫数据框Top15: 我创建了一个列来估计每个人的可引用文档数: 1 2Top15[PopEst] Top15[Energy Supply] / Top15[Energy Supply per Capita] Top15[Citable docs per Capita] Top15[Citable documents] / Top15[PopEst] 我想知道人均可引用…

df.corr和df.describe()

1:df.corr() df.corr()函数的作用是返回列与列之间的相关系数 corr_matrix df.corr() sns.heatmap(corr_matrix, annotTrue, cmapcoolwarm) 2:df.describe() 得到数字列的一些特殊值。如果是df.describe(includeO) ,则描述obje…

Oracle MySQL Hive sql 求相关性系数 corr

MySQL所有版本: CREATE TABLE sample (x float NOT NULL,y float NOT NULL,user_name varchar(255) ) ;INSERT INTO sample VALUES (1, 10, zs); INSERT INTO sample VALUES (2, 4, zs); INSERT INTO sample VALUES (3, 5, zs); INSERT INTO sample VALUES (6, 17…

CORR函数 看不明白

CORR聚集函数来计算相关系数 CORR:皮尔逊相关系数,是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。 CORR_S:斯皮尔曼等级相关 SELECT CORR(SYSDATE - hiredate, sal) AS corr_val, CORR…

COSI-Corr安装教程

hello,各位好久不见。最近要处理数据了,一步步学习COSI-Corr软件。安装很简单的,大家一起来学习吧。 1、在COSI-Corr官网点击并注册,官方会给你提供的邮箱发送软件安装包;COSI-Corr: Measuring Ground Deformation from Optical …

matlab corr2原码,matlab中corr2函数的错误

我想通过使用corr2函数的模板匹配来读取输入图像中的字母 . 为此,我创建了数字和符号模板 . 在运行读取信件的代码时,我收到以下错误: Error using corr2 Expected input number 1, A, to be two-dimensional. 用于模板创建的MAtlab代码 %CREATE TEMPLATES one=imread(1.png…

pandas——相关系数函数corr()

计算DataFrame列之间的相关系数 a np.arange(1,10).reshape(3,3)data DataFrame(a,index["a","b","c"],columns["one","two","three"])print(data)one two threea 1 2 3b 4 5 6c 7 …

回归分析中的相关度(Corr)和R^2

一、.皮尔逊相关系数(Pearson Correlation Coefficient) 1.可以用来衡量两个数值之间的线性相关程度 2.对应的取值范围为[-1,1],即存在正相关,负相关和不相关 3.计算公式: 二、R^2 1.定义:决定系数,反应…

Python机器学习:corr()分析变量之间的相关关系

变量之间存在多重共线性的情况下会影响模型的精度,这里用相关矩阵corr()和热力图heatmap()可以直观地观察变量之间的相关关系,进而判断是否要对自变量进行删除,或者降维的操作。 首先用corr()构造相关矩阵研究变量之间的相关关系&#xff1a…

理解页面置换算法

对页面置换算法的理解: 在进程运行时,若其访问的页面不在内存,而需将其调入,但内存已无空闲空间时,就需要从内存中调出一页程序或数据,送入磁盘的对换区。选择调出页面的算法就称为页面置换算法。好的页面置…

Python实现页面置换算法

Python实现页面置换算法 FIFO LRU OPT 页面置换——FIFO、LRU、OPT Python实现页面置换算法页面置换算法:一、FIFO(先进先出置换算法)1.算法解析算法原理:当需要淘汰一个页面时,总是选择驻留主存时间最长的页面进行淘…

页面置换算法java_页面置换算法之Clock算法

1.前言 缓冲池是数据库最终的概念,数据库可以将一部分数据页放在内存中形成缓冲池,当需要一个数据页时,首先检查内存中的缓冲池是否有这个页面,如果有则直接命中返回,没有则从磁盘中读取这一页,然后缓存到内…

一文看懂页面置换算法

页面置换算法分为两类 1、局部页面置换算法 最优页面置换算法(OPT、optimal)先进先出算法(FIFO)最近最久未使用算法(LRU,Least Recently Used)时钟页面置换算法(Clock)最不常用算法…

虚拟内存页面置换算法

虚拟内存页面置换算法 虚拟地址空间页表分页式分段式段页式 页面置换算法最优置换算法( OPT)先进先出算法(FIFO)最近最久未使用算法(LRU) 虚拟内存是计算机系统内存管理的一种技术。 它使得应用程序认为它拥有连续的可用的内存(一个连续完整的地址空间&a…

OS之页面置换算法

之前几篇博客记录了OS内存管理的一些知识和技术,接下来将继续深入,介绍一些页面置换算法,这里包括一些我们大家都略有耳闻的算法。 置换算法 当出现缺页故障时,需要从外存调入新的页面到内存中去,而如果此时内存已满…

os 页面置换算法

在进程运行过程中,若其所要访问的页面不在内存,而需把它们调入内存,但内部无空闲空间时,为了保证该进程能正常运行,系统必须从内存中调出一页程序或数据送到磁盘的对换区中。但应将哪个页面调出,须根据一定…

内存页面置换算法

前面我们说过了进程的调度算法,今天我们继续来盘内存页面的置换算法,给你整的明明白白的🤪🤪🤪。 内存页面置换算法主要有下面这么几种: 最佳页面置换算法(OPT)先进先出置换算法&a…

三种页面置换算法(详解)

地址映射过程中,若在页面中发现所要访问的页面不在内存中,则产生缺页中断。当发生缺页中断时,如果操作系统内存中没有空闲页面,则操作系统必须在内存选择一个页面将其移出内存,以便为即将调入的页面让出空间。而用来选…

计算机操作系统——页面置换算法

声明:本篇博客参考书籍《计算机操作系统》(西安电子科技大学出版社) 文章目录 一、最佳页面置换算法1、基本知识2、算法思想 二、先进先出(FIFO)页面置换算法1、基本知识2、算法思想 三、最近最久未使用(L…