python数据分析常用图大集合

article/2025/9/21 22:37:38

我们在做数据分析的时候,难免会用到图像来表示你要展示的东西,接下来写一下demo来表示一下各种图:

以下默认所有的操作都先导入了numpy、pandas、matplotlib、seaborn

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

数据源地址:github地址:https://github.com/mwaskom/seaborn-data

解压缩文件,拖入seaborn-data文件夹中

  

1、折线图

折线图可以用来表示数据随着时间变化的趋势

x = [2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019]
y = [5, 3, 6, 20, 17, 16, 19, 30, 32, 35]
  • Matplotlib
plt.plot(x, y)
plt.show()

  • Seaborn
df = pd.DataFrame({'x': x, 'y': y})
sns.lineplot(x="x", y="y", data=df)
plt.show()

2、直方图

直方图是比较常见的视图,它是把横坐标等分成了一定数量的小区间,然后在每个小区间内用矩形条(bars)展示该区间的数值

a = np.random.randn(100)
s = pd.Series(a) 
  • Matplotlib
plt.hist(s)
plt.show()

  • Seaborn
sns.distplot(s, kde=False)
plt.show()
sns.distplot(s, kde=True)
plt.show()

3、垂直条形图

条形图可以帮我们查看类别的特征。在条形图中,长条形的长度表示类别的频数,宽度表示类别。

x = ['Cat1', 'Cat2', 'Cat3', 'Cat4', 'Cat5']
y = [5, 4, 8, 12, 7]
  • Matplotlib
plt.bar(x, y)
plt.show()

  • Seaborn
plt.show()

4、水平条形图

x = ['Cat1', 'Cat2', 'Cat3', 'Cat4', 'Cat5']
y = [5, 4, 8, 12, 7]
plt.barh(x, y)
plt.show()

5、饼图

nums = [25, 37, 33, 37, 6]
labels = ['High-school','Bachelor','Master','Ph.d', 'Others']
plt.pie(x = nums, labels=labels)
plt.show()

6、箱线图

箱线图由五个数值点组成:最大值 (max)、最小值 (min)、中位数 (median) 和上下四分位数 (Q3, Q1)。
可以帮我们分析出数据的差异性、离散程度和异常值等。

  • Matplotlib
# 生成0-1之间的10*4维度数据
data=np.random.normal(size=(10,4)) 
lables = ['A','B','C','D']
# 用Matplotlib画箱线图
plt.boxplot(data,labels=lables)
plt.show()

  • Seaborn
# 用Seaborn画箱线图
df = pd.DataFrame(data, columns=lables)
sns.boxplot(data=df)
plt.show()

7、热力图

热力图,英文叫 heat map,是一种矩阵表示方法,其中矩阵中的元素值用颜色来代表,不同的颜色代表不同大小的值。通过颜色就能直观地知道某个位置上数值的大小。

data = np.array([[1,2,3],[4,5,6],[7,8,9]])
ax = sns.heatmap(data,annot=True)
bottom, top = ax.get_ylim()
ax.set_ylim(bottom + 0.5, top - 0.5)
plt.show()

这个需要数据集,去git上下载即可,git地址:https://github.com/mwaskom/seaborn-data下载seaborn-data文件

flights = sns.load_dataset("flights")
data=flights.pivot('year','month','passengers')
sns.heatmap(data)
plt.show()

通过 seaborn 的 heatmap 函数,我们可以观察到不同年份,不同月份的乘客数量变化情况,其中颜色越浅的代表乘客数量越多

8、散点图

散点图的英文叫做 scatter plot,它将两个变量的值显示在二维坐标中,非常适合展示两个变量之间的关系。

N = 1000
x = np.random.randn(N)
y = np.random.randn(N)
  • Matplotlib
plt.scatter(x, y,marker='x')
plt.show()

  • Seaborn
df = pd.DataFrame({'x': x, 'y': y})
sns.jointplot(x="x", y="y", data=df, kind='scatter');
plt.show()

9、蜘蛛图(雷达图)

蜘蛛图是一种显示一对多关系的方法,使一个变量相对于另一个变量的显著性是清晰可见

labels=np.array([u"推进","KDA",u"生存",u"团战",u"发育",u"输出"])
stats=[83, 61, 95, 67, 76, 88]
# 画图数据准备,角度、状态值
angles=np.linspace(0, 2*np.pi, len(labels), endpoint=False)
stats=np.concatenate((stats,[stats[0]]))
angles=np.concatenate((angles,[angles[0]]))
# 用Matplotlib画蜘蛛图
fig = plt.figure()
ax = fig.add_subplot(111, polar=True)   
ax.plot(angles, stats, 'o-', linewidth=2)
ax.fill(angles, stats, alpha=0.25)
# 设置中文字体
# font = FontProperties(fname=r"/System/Library/Fonts/PingFang.ttc", size=14) 
# ax.set_thetagrids(angles * 180/np.pi, labels, FontProperties=font)
ax.set_thetagrids(angles * 180/np.pi, labels, fontproperties="SimHei")  
plt.show()

10、二元变量分布(这个代码需要下载对应的数据源)

数据源地址:github地址:https://github.com/mwaskom/seaborn-data

解压缩文件,拖入seaborn-data文件夹中

二元变量分布可以看两个变量之间的关系

tips = sns.load_dataset("tips")
tips.head(10)
#散点图
sns.jointplot(x="total_bill", y="tip", data=tips, kind='scatter')
#核密度图
sns.jointplot(x="total_bill", y="tip", data=tips, kind='kde')
#Hexbin图
sns.jointplot(x="total_bill", y="tip", data=tips, kind='hex')
plt.show()

11、面积图

面积图又称区域图,强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。
堆积面积图还可以显示部分与整体的关系。折线图和面积图都可以用来帮助我们对趋势进行分析,当数据集有合计关系或者你想要展示局部与整体关系的时候,使用面积图为更好的选择。

df = pd.DataFrame(
np.random.rand(10, 4), 
columns=['a', 'b', 'c', 'd'])# 堆面积图
df.plot.area()# 面积图
df.plot.area(stacked=False)

12、六边形图

六边形图将空间中的点聚合成六边形,然后根据六边形内部的值为这些六边形上色。

df = pd.DataFrame(
np.random.randn(1000, 2), 
columns=['a', 'b'])
df['b'] = df['b'] + np.arange(1000)# 关键字参数gridsize;它控制x方向上的六边形数量,默认为100,较大的gridsize意味着更多,更小的bin
df.plot.hexbin(x='a', y='b', gridsize=25)

本文参考如下文章改写,感谢博主

python数据分析常用图大集合 - 雪山飞猪 - 博客园


http://chatgpt.dhexx.cn/article/DN12NZu2.shtml

相关文章

数据分析自学路线

首先必须要对想要自学数据分析的朋友表示敬佩!数据分析是个很庞大的学科体系,零零碎碎的知识点可能一辈子都学不尽,敢自学挑战的一定是个学习力和行动力超强的人! 作为一个非科班转型的初级数据分析师,常有身边朋友问…

Python数据分析常用的类库

本节只对这些库进行一个简单介绍。 1. NumPy NumPy(Numerical Python)是 Python 科学计算的基础包,它可以提供以下功能。口快速高效的多维数组对象 ndarray。 口用于对数组执行元素级计算和直接对数组执行数学运算的函数。口用于读写硬盘…

10 个最佳地理空间数据分析 GIS 软件

有人说:一个人从1岁活到80岁很平凡,但如果从80岁倒着活,那么一半以上的人都可能不凡。 生活没有捷径,我们踩过的坑都成为了生活的经验,这些经验越早知道,你要走的弯路就会越少。 数据可视化并不是简单的把…

云计算机平台的特性,云平台对比传统平台特点分析

云计算的一个核心理念就是通过不断提高“云”的处理能力来减少用户终端的处理负担,最终使用户终端简化成一个单纯的输入输出设备,并能够按需享受“云”的强大计算能力。 而云计算平台与传统应用模式相比,具有如下特点。 1、虚拟化技术 现有的云计算平台的最大的特点是利用软…

什么是SAP Cloud Platform(SAP云平台) ?

1. 引言 SAP Cloud Platform (SCP) 是SAP目前主推的一个发展方向,从2012年SAP HANA Cloud Portfolio到后来的SAP HANA Cloud Platform,再到2017年SAP Cloud Platform的发布,SAP的云平台经过了一系列的演化过程。 在讨论SCP这一技术时&#…

云计算机是什么原理,云电脑的运行原理是什么?

大家好,这里是酷乐米小编龙牧,达龙云电脑这样的云游戏平台时什么原理来实现让玩家性能不是很好的电脑可以运行大型游戏呢? 这里就要说下云游戏的概念了,云游戏是以云计算为基础的游戏方式,在云游戏的运行模式下&#x…

云测试是什么?

云测(Cloud Testing),是基于云计算的一种新型测试方案,服务商提供多种平台,多种浏览器、移动设备、服务器的平台,一般的用户在本地用自动化测试框架(Appium、Selenium、Airtest等)把…

物联网云平台概念及系统架构

物联网云平台概念 联动感知层和应用层的中枢系统,功能与价值凝聚的PaaS软件 物联网云平台是由物联网中间件这一概念逐步演进形成。简单而言,物联网云平台是物联网平台与云计算的技术融合,是架设在IaaS层上的PaaS软件,通过联动感知…

容器云平台详细介绍

前言 容器是一种轻量级、可移植、自包含的软件打包技术,使应用程序可以在几乎任何地方以相同的方式运行。开发人员在自己笔记本上创建并测试好的容器,无需任何修改就能够在生产系统的虚拟机、物理服务器或公有云主机上运行。“从过去以物理机和虚拟机为…

什么是PaaS云平台?

什么是PaaS云平台? PaaS是(Platform as a Service)的缩写,是指平台即服务。把服务器平台作为一种服务提供的商业模式,通过网络进行程序提供的服务称之为SaaS(Software as a Service),而云计算时代相应的服务…

云平台是什么意思 云服务平台有哪些【详细介绍】

云平台是什么意思 云服务平台有哪些【详细介绍】 摘要:云平台是什么意思?随着云计算的不断发展,很多的云平台都应运而生,这种平台允许开发者们或是将写好的程序放在“云”里运行,或是使用“云”里提供的服务,云服务有…

云平台是什么,云平台的发展对现今的企业和个人带来的好处

云平台,也称云计算平台。 云计算: 通俗的理解就是一组一堆的远程计算机与服务器协同工作构建出一个云组,对用户提供服务,这不是一个普通的计算机,是一个超级计算机,可以进行运算的计算机,而再通过云计算超…

什么是云平台,云平台的分类和优势有哪些?

云平台又称云计算平台,就是一个云上的平台, 为用户提供各种各样的远程服务。通俗理解云指的是远程计算机,计算指指计算机的交付、使用与服务,将云和计算组合在一起就形成了一个平台,云平台提供计算、网络和存储能力。 云是将服务器…

微信公众号自定义分享(vue)

先附上微信公众平台&#xff0c;官网介绍的很详细&#xff0c; https://mp.weixin.qq.com/wiki?tresource/res_main&idmp1421141115 微信公众号右上角自定义分享功能主要就三步&#xff1a; 1、先引入JS文件 <script type"text/javascript" src"htt…

如何在微信公众号分享PPT?

微信公众号文章分享PPT文件&#xff0c;借助小程序&#xff0c;可以很简单的实现。 总结&#xff1a; 第一步&#xff1a;将附件上传到“微附件”小程序&#xff0c;或官方网站&#xff0c;这里只演示上传到官网的。 第二步&#xff1a;在微信公众号后台操作就可以了。 详细…

微信公众号实现带图卡片分享链接

环境:PHP TP5框架 后端代码: /*** 使用json给前端返回必要的微信JS-SDK数据* return \think\response\Json*/public function get_js_api_data(){//获取微信accesstoken 此处不做赘述$AccessToken WechatService::getAccessToken();//生成一个随机字符串 传给前端用$nonceStr…

微信公众号网页分享设置及问题

准备工作 1.微信公众号、获取appId、secret&#xff1b; 2.在公众号后台填写JS接口安全域名和IP白名单&#xff1b; 后台工作 请求微信接口并给前端返回noncestr&#xff08;生成签名的随机串&#xff09;、timestamp&#xff08;生成签名的时间戳&#xff09;、signature&a…

微信公众号分享签名sign获取

微信 JS 接口签名校验工具 http://mp.weixin.qq.com/debug/cgi-bin/sandbox?tjsapisign 后台代码&#xff1a; /*** 分享的参数* author LHB* since JDK 1.8*/ResponseBodyRequestMapping(value "/getShareParam")public ResultOutDto getShareParam(HttpServl…

php微信转发无法显示标题图片,解决微信公众号分享朋友圈不显示标题图片描述的方法...

我在微信开发者工具调试都是正确&#xff0c;为什么在真机进行测试&#xff0c;就不会显示分享标题图片描述语呢。 检查分享相关微信接口也是正确&#xff0c;代码如下&#xff1a; wx.ready(function () { wx.onMenuShareTimeline({ title: ".$c_title.", desc:&q…

微信公众号分享外部链接踩到的坑,具体说一说

公众号中嵌入h5html链接&#xff0c;分享自定义小卡片踩坑指南~~ 对接成功后&#xff0c;wx.onMenuShareAppMessage,onMenuShareTimeline方法调用时&#xff0c;自定义的标题、描述内容、link是在调用wx.config的时候就生成了&#xff0c;不是在点击分享时才生成的&#xff0c;…