Matplotlib之散点图绘制

article/2025/11/5 5:58:44

文章目录

  • 1. 散点图简介
  • 2. 散点图的应用场景:
  • 3. 绘制散点图
  • 4. 回归分析

1. 散点图简介

散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。

通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互
关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据
点就会相对密集并以某种趋势呈现。

数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。

在这里插入图片描述

2. 散点图的应用场景:

  1. 观察数据集的分布情况。
  2. 通过分析规律,根据样本数据特征计算出回归方程。

3. 绘制散点图

散点图的绘制,使用的是 plt.scatter 方法,这个方法有以下参数:

  1. x,y :分别是x轴和y轴的数据集。两者的数据长度必须一致。
  2. s :点的尺寸。如果是一个具体的数字,那么散点图的所有点都是一样大小,如果是一个序
    列,那么这个序列的长度应该和x轴数据量一致,序列中的每个元素代表每个点的尺寸。
  3. c :点的颜色。可以为具体的颜色,也可以为一个序列或者是一个 cmap 对象。
  4. marker :标记点,默认是圆点,也可以换成其他的。
  5. 其他参数参考:matplotlib.pyplot.scatter官方文档。

比如我们有一组两万条左右得运动员身高和体重以及年龄的数据表格 new_athlete.csv :

在这里插入图片描述
在这里插入图片描述

那么可以通过以下代码来绘制散点图:

import matplotlib.pyplot as plt
import numpy as np
from matplotlib import font_managerfont = font_manager.FontProperties(fname="C:\Windows\Fonts\msyh.ttc")
athletes = pd.read_csv('new_athlete.csv').dropna()
athletes.head()
male_athletes = athletes[athletes['Sex'] == 'M']
female_athletes = athletes[athletes['Sex'] == 'F']
male_mean_height = male_athletes['Height'].mean()
female_mean_height = female_athletes['Height'].mean()
male_mean_weight = male_athletes['Weight'].mean()
female_mean_weight = female_athletes['Weight'].mean()
plt.figure(figsize=(10,5))
plt.scatter(male_athletes['Height'],male_athletes['Weight'],s=male_athletes['Age'],marker='^',color='g',label='男性',alpha=0.5)
plt.scatter(female_athletes['Height'],female_athletes['Weight'],color='r',alpha=0.5,s=female_athletes['Age'],label='女性')
plt.axvline(male_mean_height,color="g",linewidth=1)
plt.axhline(male_mean_weight,color="g",linewidth=1)
plt.axvline(female_mean_height,color="r",linewidth=1)
plt.axhline(female_mean_weight,color="r",linewidth=1)
plt.xticks(np.arange(140,220,5))
plt.yticks(np.arange(30,150,10))
plt.legend(prop=font)
plt.xlabel("身高(cm)",fontproperties=font)
plt.ylabel("体重(kg)",fontproperties=font)
plt.title("运动员身高和体重散点图",fontproperties=font)
plt.grid()
plt.show()

在这里插入图片描述

4. 回归分析

有一组数据后,我们可以对这组数据进行回归分析,回归分析可以帮助我们了解这组数据的大体走
向。
回归分析按照涉及的变量的多少,分为一元回归多元回归分析
按照自变量的多少,可分为简单回归分析多重回归分析
按照自变量和因变量之间的关系类型,可分为线性回归分析非线性回归分析

如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析

如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多重线性回归分析

在这里插入图片描述
通过以上运动员散点图的分析,我们总体上可以看出来是满足线性回归的,因此可以在图上绘制一个线性回归的线条。想要绘制线性回归的线条,需要先按照之前的数据计算出线性方程,假如 x 是自变量, y 是因变量,那么线性回归的方程可以用以下几个来表示:

y = 截距+斜率*x+误差

只要把这个方程计算出来了,那么后续我们就可以根据 x 的值,大概的估计出 y 的取值范围,也就是预测。

如果我们针对以上运动员的身高和体重的关系,只要有身高,那么就可以大概的估计出体重的值。

回归方程的绘制我们需要借助 scikit-learn 库,这个库是专门做机器学习用的,我们需要使用里面的线性回归类 sklearn.liear_regression.LinearRegression 。示例代码如下:

# from sklearn.linear_model import LinearRegression
# male_athletes = athletes[athletes['Sex'] == 'M'].dropna()
# female_athletes = athletes[athletes['Sex'] == 'F'].dropna()
# xtrain = male_athletes['Height']
# ytrain = male_athletes['Weight']
# # 生成线性回归对象
# model = LinearRegression()
# # 喂训练数据进去,但是需要把因变量转换成1列多行的数据
# model.fit(xtrain[:,np.newaxis],ytrain)
# # 打印斜率
# print(model.coef_)
# # 打印截距
# print(model.intercept_)
# line_xticks = xtrain
# # 根据回归方程计算出的y轴坐标
# line_yticks = model.predict(xtrain[:,np.newaxis])plt.figure(figsize=(15,5))
male_athletes = athletes[athletes['Sex'] == 'M']
male_heights = male_athletes['Height']
male_weights = male_athletes['Weight']
male_height_mean = male_heights.mean()
male_weight_mean = male_weights.mean()female_athletes = athletes[athletes['Sex'] == 'F']
female_heights = female_athletes['Height']
female_weights = female_athletes['Weight']
female_height_mean = female_heights.mean()
female_weight_mean = female_weights.mean()plt.scatter(male_heights,male_weights,s=male_athletes['Age'],marker='^')
plt.scatter(female_heights,female_weights,s=female_athletes['Age'],alpha=0.5)
plt.axvline(male_height_mean,linewidth=1,c='r')
plt.axhline(male_weight_mean,linewidth=1,c='y')from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(male_heights.values[:,np.newaxis],male_weights)
predict_male_weight = model.predict(male_heights.values[:,np.newaxis])
plt.plot(male_heights,predict_male_weight)

在这里插入图片描述

为便于学习交流草创了一个q群: Python炼丹大师交流群
后端 爬虫 数据分析 机器学习等和python相关的都可以在此畅所欲言
编程资源:编程学习资源传送门

文章到此结束,但愿本文能对你有一点点帮助,欢迎三连,点个赞,收个藏啥的,有问题的尽管砸来,我有故事你有酒,好好交流不分手!下次见!


http://chatgpt.dhexx.cn/article/2TpAwiAO.shtml

相关文章

Python数据可视化——散点图

PS: 翻了翻草稿箱, 发现居然存了一篇去年2月的文章。。。虽然naive,还是发出来吧。。。 本文记录了python中的数据可视化——散点图scatter, 令x作为数据(50个点,每个30维),我们仅可视化前两维…

Matplotlib 散点图 绘制详解

目录 基础点的大小点的颜色透明度颜色条多组散点 1 散点图 - 基础 代码 import matplotlib.pyplot as plt import numpy as np# 第一组散点 x np.array([1, 2, 3, 4, 5, 6, 7, 8]) y np.array([1, 4, 9, 16, 7, 11, 23, 18]) plt.scatter(x, y) # x 代表x轴 y 代表y轴…

python 绘制三维散点图(已实现)

import numpy as np # 用来处理数据 import matplotlib.pyplot as pltx np.array([1, 2, 4, 5, 6]) y np.array([2, 3, 4, 5, 6]) z np.array([1, 2, 4, 5, 6])ax plt.subplot(projection 3d) # 创建一个三维的绘图工程 ax.set_title(3d_image_show) # 设置本图名称 ax…

用python绘制散点图

在python中画散点图主要是用matplotlib模块中的scatter函数,先来看一下scatter函数的基本信息。 网址为:点击打开链接 可以看到scatter中有很多参数,经常使用的参数主要有以下几个: c: marker: 数据、代码和绘制的图如…

python绘图之散点图

python中matplotlib库入门(2)之绘制散点图 这里写目录标题 python中matplotlib库入门(2)之绘制散点图一.导入库二.设置文字三.设置坐标轴参数四.绘制点五.对点的继续处理1.自定义颜色2.颜色映射 补充1补充2补充3 一.导入库 impor…

python制作三维散点图

最近需要做个文献分类汇总,老师要求要用三维散点图来画。中间还是有一些困难的,稍微记录下。 1.用python读取excel整理的数据,使用的是openpyxl库 方法比较简单,考虑到后续的标签问题,我直接把数据全部用数字代替&…

Python matplotlib绘制散点图

Python matplotlib绘制散点图 上篇文章介绍了使用matplotlib绘制折线图,参考:https://blog.csdn.net/weixin_43790276/article/details/109191533,本篇文章继续介绍使用matplotlib绘制散点图。 一、matplotlib绘制散点图 # codingutf-8 im…

Python绘图-散点图(scatter)

绘制散点图的语法格式如下: ​ plt.scatter(x, y, sNone, cNone, markerNone, cmapNone, normNone, vminNone, vmaxNone, alphaNone, linewidthsNone, *, edgecolorsNone, plotnonfiniteFalse, dataNone, **kwargs)​ x,y:表示数据点的位置。 s:表示数据点的大小…

[Python] 散点图(二维散点图、三维散点图、散点图矩阵)

目录 1 两主特征:二维散点图 1.1 二维散点图 1.2 二维分类散点图 1.3 气泡图 2 三主特征:三维散点图 2.1 三维散点图 2.2 三维分类散点图 3 多主特征:二维散点图矩阵 3.1 二维散点图矩阵 3.2 二维分类散点图矩阵 以python自带数据鸢…

Python数据可视化之散点图(基础篇---图文并茂详细版!!!)

Python数据可视化之散点图 介绍准备工作所需的库虚拟环境 简单散点图总结 两种不同颜色和图例的散点图总结 介绍 •数据可视化的应用十分广泛,几乎可以应用于自然科学、工程技术、金融、通信和商业等各种领域。下面我们基于Python,介绍一下第一个常用知识点—散点图…

C语言求和问题

问题描述:编写一个程序,求s1(12)…(123…n)

c语言求和

或者可以这样写 注意!下面的写法是错的,数字是随机的,因为只声明没赋值

c语言数列求和中有乘法,C语言数列求和(使用while循环)

这是一个C语言 while 循环的示例,已知有下面的数列: 现在任意给出一个整数 k(1≤k≤15),要求计算出一个最小的 n,使得 Sn>k。 问题分析 输入:一个整数k(1≤k≤15)。 输出:最小的n。 本题算法非常简单&am…

用C语言计算矩阵求和

样例描述&#xff1a; 代码如下&#xff1a; #include<stdio.h> int main() {int N,n,a[51][51],r,c,i,num1,num2,num3,num4;scanf("%d",&N);nN*N;for(r1;r<N;r){for(c1;c<N;c)scanf("%d",&a[r][c]);}for(r1;r<N;r){num10;for(c1;…

c语言初学者如何编写一个相加求和程序

欢迎来到南方有乔木的博客&#xff01;&#xff01;&#xff01; 博主主页&#xff1a;点击点击&#xff01;戳一戳&#xff01;&#xff01; 博主QQ:1636758318 博主简介&#xff1a; 一名在校大学生&#xff0c;正在努力学习Java语言编程。穷且意坚&#xff0c;不坠青云之志&…

C语言斐波那契数列求和两种方法

递归调用函数&#xff1a; #define _CRT_SECURE_NO_WARNINGS int fun(int n); #include<stdio.h> int main() {//斐波那契数列递归求法int a[100] { 0,1,1 };int n, i, sum 0;scanf("%d", &n);for (i 1; i <n; i){sum fun(i);}printf("%d\n&q…

用c语言写一个求和的程序,C语言实现两数求和

能够使一个正确的C语言程序执行的必要顺序&#xff1a;上机输入与编辑源程序(.c)-->对源程序进行编译(.obj)&#xff0c;得到目标函数-->将目标程序 与库函数链接&#xff0c;得到可执行的目标程序(.exe)-->运行可执行的目标程序。今天是一个加法求和的功能的程序&…

c语言 中的求和函数,0基础理解C语言调用汇编实现求和函数

0基础踏入嵌入式开发的第一坑!用无敌简简单单的C程序调用汇编程序实现整数相加,这辈子都有阴影了,这大概是一条一条指令谷歌百度搜出来的结果,学习从来没这么卑微过,唔QAQ 工程大概长这样: add10.s ;routine for the addition of many integers. ;R0 is the counter of t…

C语言整数求和

带注释 #include <stdio.h> //头文件 int main(void) //主函数无参数&#xff0c;返回的值是整数 {long num; //定义了一个长整型变量numlong sum0L; //定义了一个长整型变量sum&#xff0c;把sum初始化为long类型的0printf("Please input an integer to s…

C语言用函数写两数之和

#include<stdio.h> void main() { int a,b,sum; scanf("%d,%d",&a,&b); sumab; printf("%d%d%d",a,b,sum); } 主函数接收和输出&#xff0c;被调函数求和 #include<stdio.h> int add(int a,int b); void main() { int a…