Python图像处理

article/2025/9/21 15:12:49

一、简介

实现计算机视觉任务的过程中,不可避免地需要对图像进行读写操作以及图像预处理操作,下面介绍两个常用的Python图像处理库:OpenCV和Pillow。

OpenCV全称是由英特尔公司资助的开源计算机视觉库。

  • 它由一系列C函数和少量C++类所组成,实现图像处理和计算机视觉方面的很多通用算法,例如特征检测与跟踪、运动分析、目标分割与识别以及3D重建等。

  • OpenCV作为基于C/C++语言编写的跨平台开源软件,可以运行在Linux、Windows、Android和MacOS操作系统上,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

1.1 图像处理-OpenCV

OpenCV是模块结构的,有以下主要模块。

  • 【core】–核心功能模块,包含内容有:OpenCV基本数据结构、动态数据结构、绘图函数、数组操作相关函数、辅助功能与系统函数和宏、与OpenGL的互操作。
  • 【imgproc】–图像处理模块,包含内容有:线性和非线性的图像滤波、图像的几何变换、图像转换、直方图相关、结构分析和形状描述、运动分析和对象跟踪、特征检测、目标检测等内容。
  • 【features2D】–2D功能模块,包含以下内容:特征检测和描述、特征检测器、描述符提取器等内容。
  • 【highGUI】–高层GUI图形用户界面,包含:媒体的I/O输入输出、视频捕捉、图像和视频的编码解码、图形交互界面的接口等内容。

1.2 图像处理- PIL和Pillow

作为Python2的第三方图像处理库是Pillow的前身。随着Python3的更新,PIL移植到Python3更名为Pillow。与OpenCV一样,Pillow也是模块结构,主要包括以下结构。

  • 【Image】–图像功能模块,包含内容有:读写图像、图像混合、图像放缩、图像裁切、图像旋转。

  • 【ImageFilter】–图像滤波功能模块,包含内容有:各类图像滤波核。

  • 【ImageEnhance】–图像增强功能模块,包含内容有:色彩增强、亮度增强、对比度增强、清晰度增强。

  • 【ImageDraw】–图像绘画功能模块,包含内容有:绘制几何形状、绘制文字。

二、 常用图像类型

2.1 二值图像

二值图像只有黑白两种颜色,如图所示。图像中的每个像素只能是黑或白,没有中间的过渡。因此二值图像的像素值只能为0或1,0表示黑色,1表示白色。
在这里插入图片描述

2.2 灰度图像

  • 灰度图像只表达图像的亮度信息没有颜色信息,如(a)图所示。
  • 灰度图像的每个像素点上只包含一个量化的灰度级(即灰度值)。
  • 像素点的亮度水平如(b)图所示,通常使用1字节(8位二进制数)来存储灰度值,因此用正整数表示灰度值的范围是0~255。
    在这里插入图片描述

2.3 RGB图像

  • RGB(Red、Green、Blue)图像如(a)图,可以看成是由多个RGB像素点组成。
  • 每个彩色像素点分别由R、G、B三种颜色空间组成如(b)图,本质是3维数组。
  • 在RGB颜色空间中,任意色光都可以用R、G、B三色不同分量的相加混合而成。
    在这里插入图片描述

2.4 常用颜色空间简介

  • 实际应用中常用的颜色空间很多,通常使用3个独立的变量对颜色进行描述,例如RGB、HSV、YUV等。
  • 一个图像的不同的颜色空间是可以转换的,cv2.cvtColor可以实现颜色的转换。
    • cv2.COLOR_BGR2GRAY
    • cv2.COLOR_BGR2RGB
    • cv2.COLOR_BGR2HSV
    • cv2.COLOR_BGR2YUV
    • cv2.COLOR_BGR2HLS

三、OpenCV图像读写与显示

  • 通过OpenCV库对数字图像进行处理时,涉及到的基础操作包括读取、显示、写出图像文件。
  • 在OpenCV库中,图像数据是以NumPy数组的形式存在。

3.1 读入图像

  • 在python的OpenCV中,通过cv2.imread()函数读入图像数据,其基本使用格式如下。
  • cv2.imread(filename, flags)
  • 在默认情况下通过cv2.imread()函数读入图像数据为3通道的彩色图,像素值为8位的非负整数,图像数据以NumPy中ndarray的方式存在。
  • 如果定义了cv2.imread()读入模式为cv2.IMREAD_GRAYSCALE那么读入图像为单通道的灰度图。
  • 需要注意的是,通过OpenCV读入彩色图像数据的颜色通道顺序为BGR(蓝、绿、红)并非常用的RGB(红、绿、蓝)顺序。
  • 在OpenCV中,读取到的图像数组维度可以表示为:
    (高,宽,通道数)即(height, width, channel)。OpenCV图像坐标与常规的数学坐标有区别,左上角位置为坐标原点。
    • 在Windows【画图】工具中,帽檐红点坐标为(248, 102),但在OpenCV中像素位置应为(102, 248)。
    • X轴 == 列位置 == 图像宽
    • Y轴 == 行位置 == 图像高
    在这里插入图片描述

3.2 显示图像

  • 在OpenCV中,通过cv2.imshow()函数显示图像数据,其基本使用格式如下。
  • cv2.imshow(winname, img)
  • 在OpenCV中,通过cv2.waitKey()函数设置图片窗口显示时长,其基本使用格式如下。
  • cv2.waitKey([,delay])
  • waitKey作用是图像显示时等待用户按键触发,如果用户按键触发或时间超过了设置的时间则退出图片展示。
  • cv2.waitKey(0)的作用是令程序一直停留在显示图像的状态。如果没有增加cv2.waitKey(0),那么程序运行完毕后,图像显示窗口会自动关闭,即一闪而逝。

3.3 写出图像

  • 在OpenCV中,通过cv2.write()函数保存图像数据,其基本使用格式如下。
  • cv2.imwrite(filename, img)
import cv2
import matplotlib.pyplot as plt
import numpy# 读写图像
img = cv2.imread(filename='lena.jpg', flags=cv2.IMREAD_GRAYSCALE)
img.shape
# (377, 373)
img.dtype
# dtype('uint8')# 图像展示
cv2.imshow(winname='lena', mat=img)
cv2.waitKey(0)# 图像保存
cv2.imwrite(filename='test_img.jpg', img=img)

四、图像几何变换

4.1 图像平移

  • 图像平移变换将一幅图像中的所有像素点都按照给定的偏移量在水平方向(沿x轴方向)或垂直方向(沿y轴方向)移动,是图像几何变换中较为简单的一种变换。

  • 图像平移原理示意图如下图所示。
    在这里插入图片描述

  • 假设对点P_0 (x_0,y_0 )进行平移后得到点P(x,y),其中x方向的平移量为∆x,y方向的平移量为∆y ,则点P(x,y)的坐标如下式。
    在这里插入图片描述

  • 利用齐次坐标表示图像平移变换前后点P_0 (x_0,y_0 )到点P(x,y)的关系如下式所示。
    在这里插入图片描述
    实现步骤:

  • 1. 定义平移变换矩阵: 例如:np.float32([[1,0,50], [0,1,100]])

    • [1,0,50]表示在x轴方向移动50个单位
    • [0,1,100]表示在y轴方向移动100个单位

  • 2. 执行转换:cv2.warpAffine (src, M, dsize)
    在这里插入图片描述
    通过OpenCV实现图像平移操作,结果如下图所示,(a)为原图和(b)为平移后图像。
    在这里插入图片描述

import cv2
import matplotlib.pyplot as plt
import numpy as npimg = cv2.imread('lena.jpg')
height, width, channel = img.shape
# 图像平移
# 1、定义平移变换矩阵
M = np.float32([[1,0,50], [0,1,100]])
# 2、执行平移变换
img_tran = cv2.warpAffine(src=img, M=M, dsize=(height, width))
cv2.imshow('image translation', img_tran)
cv2.waitKey(0)

4.2 图像旋转

  • 图像旋转(Rotation)是指图像以某一点为中心旋转一定的角度形成一幅新的图像的过程。通常是以图像的中心为圆心旋转,将图像中的所有像素点都旋转一个相同的角度。
  • 图像旋转原理如图所示,将点(x_0,y_0)绕原点o顺时针旋转至点(x_1,y_1 ),其中a为旋转角,r为点(x_0,y_0 )到原点的距离, b为原点o到点(x_0,y_0 )的线段与x轴之间的夹角。在旋转过程中, r保持不变。
    在这里插入图片描述
  • 设旋转前,x_0、y_0的坐标分别为x_0=r cos⁡b、y_0=r sin⁡b,当旋转a角度后,坐标x_1、y_1的值分别如下式所示。
    在这里插入图片描述
    上式的矩阵的形式如下式所示。
    在这里插入图片描述
    实现步骤:
  • 1. 计算旋转变换矩阵: cv2.getRotationMatrix2D (center, angle, scale)
    在这里插入图片描述
  • 2. 执行转换:cv2.warpAffine (src, M, dsize)
    在这里插入图片描述
    通过OpenCV实现图像旋转,得到的效果如图所示。
    在这里插入图片描述
# 图像旋转
# 1、定义旋转变换矩阵
M = cv2.getRotationMatrix2D(center=(height*0.5, width*0.5), # 旋转的中心位置坐标angle=45,   # 旋转的角度scale=0.8   # 缩放比例)
# 2、执行旋转变换
img_rotation = cv2.warpAffine(img, M, dsize=(height,width))
cv2.imshow('image_rotation', img_rotation)
cv2.waitKey(0)

4.3 图像缩放

  • 图像比例缩放是指将给定的图像在x轴方向按比例缩放f_x倍,在y轴方向按比例缩放f_y倍,从而获得一幅新的图像。如果f_x=f_y,即x轴方向和y轴方向缩放的比率相同,此比例缩放为图像的全比例缩放。如果f_x≠f_y,那么图像的比例缩放会改变原始图像的像素间的相对位置,产生几何畸变。
  • 在OpenCV中cv2.resize(src, dsize, fx, fy, interpolation)可以实现图像缩放。
    在这里插入图片描述
  • 具体实现图像缩放有多种插值方法,OpenCV的resize函数提供了如下5种常见方法。
    • 最邻近插值:cv2.INTER_NEAREST
    • 双线性插值:cv2.INTER_LINEAR
    • 区域插值:cv2.INTER_AREA
    • 三次样条插值:cv2.INTER_CUBIC
    • Lanczos插值:cv2.INTER_LANCZOS4
# 图像缩放
# 1、直接指定缩放大小
img_res = cv2.resize(img, dsize=(244,244))
img_res.shape
# (244, 244, 3)
cv2.imshow('image_resize', img_res)
cv2.waitKey(0)# 2、最近邻插值
img_near = cv2.resize(img, dsize=None, fx=1.5, fy=1,interpolation=cv2.INTER_NEAREST)
cv2.imshow('img_near', img_near)
cv2.waitKey(0)

在这里插入图片描述


http://chatgpt.dhexx.cn/article/yaXlQwKw.shtml

相关文章

OpenCV-Python图形图像处理:制作雪花飘落特效

☞ ░ 老猿Python博文目录:https://blog.csdn.net/LaoYuanPython ░ 一、引言 前几天有博友咨询,能否在视频中实现雪花飘落的效果,答案是肯定的。老猿前天简单构思了一下,利用周末时间,使用OpenCV-Python通过图像循环…

图像处理程序的设计与实现

一、要求: 1.利用Qt和QPainter实现一个图像处理程序,有菜单栏、工具栏和状态栏 2.有图像选择对话框,以选择和读取图像 3.状态栏显示图像的像素,位深,导入图像的路径和鼠标所在点的像素点坐标 4.可以对图像缩放&#xf…

C#图形化程序设计知识总结

图形化程序设计 用可视化的界面进行程序设计 逃出控制台丑丑的黑框 知识导图 图为图形化程序设计的内容清单 Windows窗体程序设计 窗体设计 窗体是一个窗口或对话框,是存放各种控件的容器,可用来向用户显示信息 一个Windows应用程序可以包含多个窗体 …

python 图像分割_5行Python代码实现图像分割的步骤详解

众所周知图像是由若干有意义的像素组成的,图像分割作为计算机视觉的基础,对具有现有目标和较精确边界的图像进行分割,实现在图像像素级别上的分类任务。 图像分割可分为语义分割和实例分割两类,区别如下: 语义分割&am…

台式计算机驱动程序未被安装,计算机图形驱动程序安装失败的原因及其解决方法...

由于许多问题,兼容性和数字签名,计算机图形驱动程序可能会失败. 很有可能没有启用Windows安装程序服务. 每个问题都有不同的解决方案. 如何确定问题的原因,可以借用软件进行检测,也可以尝试一种然后修复. 如果由于Windows Install…

LabVIEW程序框图保存为图像

LabVIEW程序框图保存为图像 想将LabVIEW程序框图保存为标准图像文件,以便可以在LabVIEW之外查看或在文档中使用。如何将程序框图生成为图像? 可以通过打印VI或以编程方式获取LabVIEW程序框图图像。 要打印VI,请使用以下步骤: …

Python图形绘制程序设计

第1关:绘制多边形 任务描述 本关任务:依照案例教程例6-2,用多边形函数绘制各种多边形图形。 编程要求 根据提示,在右侧编辑器补充代码。 测试说明 平台会对你编写的代码进行测试: 开始你的任务吧,祝你成功! 第2关:绘制五角星图形 任务描述 本关任务:绘制一个黄色…

升级计算机的图形卡和驱动程序,如何升级计算机图形卡,计算机图形卡升级方法图...

[哈哈IT网络中关村显卡]如何升级计算机显卡,通常我们会对显卡驱动程序做进一步的升级,这有助于提高显卡的性能,达到达到显卡升级的目的. 显卡驱动程序升级使计算机显示效果更好,显示效果也得到了提高. 下面介绍如何升级计算机图形…

计算机图形驱动程序原理,您知道更新计算机图形驱动程序的作用吗?怎么做

购买或使用计算机时,为了获得更好的视觉体验并避免显示的AV质量,我们通常在选择时安装独立的显卡!使用计算机时,有时第三方软件会提示您更新计算机图形驱动程序,但有时却没有!更新计算机图形驱动程序有什么…

VTK图形图像开发进阶-学习笔记 01 VTK概述

1.1 VTK概述 1.1.1VTK是什么 1.1.2VTK能做什么 1.1.3如何获取VTK源码 略 1.1.4 VTK学习资源 略 1.2 VTK编译安装 略 1.3创建一个简单的VTK程序 步骤一:创建目录A: D:\VTK\example\Chap01 步骤二:在目录A中创建txt文件:CMa…

用Java完成图形图像绘制

我们要来图形图像的处理,目标就是滑动鼠标绘制一根直线,绘制一个矩形,绘制一个圆,并且绘制任意的一个三角形,和任意的一个等腰三角形 我们先创建一个DrawPad类,在这个类里面完成一些操作 步骤1、创建一个…

图形图像学习随笔:计算机图形学的一些基本概念

本文内容摘抄于:《计算机图形学的概念》 一、计算机图形学的范畴 1、图形主要分为两类,一类是基于线条信息表示的,如工程图、等高线地形图、曲面的线框图等;另一类是明暗图,也就是通常所说的真实感图形; …

升级计算机的图形卡和驱动程序,驱动程序向导如何更新图形卡驱动程序?更新图形驱动程序方法说明...

有许多用户使用驱动程序向导,并且一些新用户不清楚更新图形驱动程序的教程. 今天,我将带给您有关更新图形驱动程序的教程. 希望它能对您有所帮助. 我们首先打开计算机上已安装的驱动程序向导软件,然后进入软件,然后单击页面“立即…

大数据学习内容有哪些?大数据学习路线图

很多人想学习大数据,但是都不清楚大数据学习应该怎么下手。大数据开发工程师简单整理了一下大数据学习路线图,希望对于学习大数据的朋友,有一定的帮助。 总的来说,如果是从零基础开始学习,总共分为八个阶段 第一阶段:HTML+css 第二阶段:JAVASE学习 第三阶段:javaweb …

(转载)大数据学习路线大数据学习路线

一、背景介绍 本人目前是一名大数据工程师,项目数据50T,日均数据增长20G左右,个人是从Java后端开发,经过3个月的业余自学成功转型大数据工程师。 二、大数据介绍 大数据本质也是数据,但是又有了新的特征&#xff0c…

2022最全大数据学习路线(建议收藏)

【不要错过文末彩蛋】 申明: 本文旨在为【大数据自学者|大数据专业学生|工资低的程序员(Java/Python等)】提供一个从入门到入职的的大数据技术学习路径,不适合5年以上大数据工程师的进阶学习。 前言: 一、个人介绍 …

大数据学习的必要性,让你走向时代前沿!

大数据及人工智能可谓是目前最热门的行业,从走在前沿的科技公司,到努力创新的传统行业,几乎都想把握这个新“风口”。一部分学校也走上了大数据的道路。 在这里还是要推荐下我自己建的大数据学习交流群:199427210,群里都是学大数据开发的,如果你正在学习高大上大数据 ,小…

2022年Python+大数据学习路线图,源码笔记,最优学习资源

任何学习过程都需要一个科学合理的学习路线,才能够有条不紊的完成我们的学习目标。Python大数据所需学习的内容纷繁复杂,难度较大,所以今天特别为大家整理了一个全面的Python大数据学习路线图,帮大家理清思路,攻破难关…

大数据学习路线图(2023完整版)适合收藏

大数据开发是一门涉及处理和分析大规模数据的技术领域,随着大数据技术的不断发展和应用,对大数据开发人员的需求也在逐渐增加。就业前景相对较好,尤其在科技行业和数据驱动型企业中。大数据开发的前景还是有很多优势的,就业范围广…