Hough 变换

article/2025/9/29 6:12:44

Hough 变换是图像处理中,检测直线最基本,也是应用最广泛的一种传统方法。虽然现在是深度学习大行其道的时代,但是很多传统的算法,依然有其参考的价值所在,至少从数学表达上来看,是更加的简洁,有理有据。

在介绍 Hough 变换之前,我们先回顾一下中学时代学的一些知识,我们学过直角坐标系,也就是常说的 X-Y 坐标系,我们知道在直角坐标系里,一条直线可以简单的用两个参数来表示 y = k x + b y = kx + b y=kx+b,同时我们学过极坐标系,一条直线可以由法向半径 ρ \rho ρ θ \theta θ 表示, ρ = x c o s θ + y s i n θ \rho = x cos \theta + y sin \theta ρ=xcosθ+ysinθ,所以一条直线可以有两种参数形式来表示:

y = k x + b ρ = x c o s θ + y s i n θ y = kx + b \\ \rho = x cos \theta + y sin \theta y=kx+bρ=xcosθ+ysinθ

在这里插入图片描述
所以一条直线可以由直角坐标系下的 k , b k, b k,b 来决定,也可以由极坐标系下的 KaTeX parse error: Expected 'EOF', got '\thea' at position 7: \rho, \̲t̲h̲e̲a̲ 来表示,给定一条直线,其对应的参数就是确定的,那么,我们知道过一个点的直线有无数条,那么过这个点就会生成很多的 KaTeX parse error: Expected 'EOF', got '\thea' at position 7: \rho, \̲t̲h̲e̲a̲

ρ = x c o s θ + y s i n θ \rho = x cos \theta + y sin \theta ρ=xcosθ+ysinθ

一组 ρ , θ \rho, \theta ρ,θ 在直角坐标系下可以决定一条直线,反过来,直角坐标系下的一个点 x , y x, y x,y 在极坐标系下可以决定一条曲线,这个时候的变量就是 ρ , θ \rho, \theta ρ,θ,如下图所示,选择直线上的三个点,每个点在极坐标系下都形成了不同的曲线

在这里插入图片描述
在图像中,一条直线有很多离散的点,每个点都会产生很多的 ρ , θ \rho, \theta ρ,θ,而有一组 ρ , θ \rho, \theta ρ,θ 是这条直线上的所有点都会产生的,如果看投票的话,就会看到这组 ρ , θ \rho, \theta ρ,θ 被命中的次数最多,如上图所示,所有极坐标系的下的曲线都会相交于某一个 ρ , θ \rho, \theta ρ,θ 而这个 ρ , θ \rho, \theta ρ,θ 其实就对应直角坐标下的一条直线。
hough 变换就是利用这样的关系,来找直线。

简单来说,就是先构造一个离散的 ρ , θ \rho ,\theta ρ,θ 空间,比如在图像域的话,一般可以假设 ρ \rho ρ 的范围是 -R ~ R,R 表示图像的长或者宽的一半, θ \theta θ 可以取 0 2 π 0 ~ 2\pi 0 2π,然后把这些参数离散化成 n n n 个区间,比如 20 或者 30 等,对应图像上的每一个像素坐标,都可以在这个 ρ , θ \rho, \theta ρ,θ 表上生成一系列的点,每个图像的像素点都能生成一系列的点,然后统计哪个 ρ , θ \rho, \theta ρ,θ 上命中的点多,那就有可能是一条直线,实际判断的时候,也会考虑设置一个阈值。

当然,如果对图像每个像素坐标都做这样的统计,显然计算量太大了,所以一般在做 hough 变换之前,会先做一个边缘检测,将明显不符合要求的点去掉,一般都做 canny 边缘检测。

OpenCV 有封装好的边缘检测与 hough 变换的函数:


# Read image img = cv2.imread('lanes.jpg', cv2.IMREAD_COLOR)   # road.png is the filename
# Convert the image to gray-scalegray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Find the edges in the image using canny detectoredges = cv2.Canny(gray, 50, 200)
# Detect points that form a linelines = cv2.HoughLinesP(edges, 1, np.pi/180, max_slider, minLineLength=10, maxLineGap=250)
# Draw lines on the image
for line in lines:x1, y1, x2, y2 = line[0]cv2.line(img, (x1, y1), (x2, y2), (255, 0, 0), 3)
# Show result
cv2.imshow("Result Image", img)

参考来源:
https://www.learnopencv.com/hough-transform-with-opencv-c-python/


http://chatgpt.dhexx.cn/article/8WhRpJS1.shtml

相关文章

Hough transform(霍夫变换)

主要内容: 1、Hough变换的算法思想 2、直线检测 3、圆、椭圆检测 4、程序实现 一、Hough变换简介 Hough变换是图像处理中从图像中识别几何形状的基本方法之一。Hough变换的基本原理在于利用点与线的对偶性,将原始图像空间的给定的曲线通过曲线表达形式变…

Hough变换

目录 一、Hough变换简介 二、Hough变换的数学理解 1.x-y变量空间至k-b参数空间的变换 2.x-y变量空间至-空间的变换 三、Hough变换应用于线检测(MATLAB实现) 1.检测步骤 2.使用MATLAB工具箱中的Hough变换函数进行边缘检测 一、Hough变换简介 霍夫变…

图像处理:Hough变换原理分析

目录 一、前言 二、直线函数的形式化表示 2.1 直线被方程表示 2.2 直线被图表表示 2.3 直线的表格表示 三、hough变换的提出 3.1 极坐标表示点和线 四、 hough变换的原理 4.1 极坐标的​编辑表格 4.2 用​编辑平面表示:过任意点P(x,y)做所有射线&#xff0…

Hough变换原理-直线检测

目录 一、简介 二、原理 三、Python代码实现 一、简介 Hough(霍夫)变换是图像处理中从图像中识别几何形状的基本方法之一。Hough变换是将图像坐标空间变换到参数空间,利用点与线的对偶性,将原始图像空间的给定的曲线&#xff08…

YUV444、YUV422、YUV420、YUV420P、YUV420SP、YV12、YU12、NV12、NV21

前言 各种YUV格式多如牛毛啊,刚开始学起来确实很费劲,网上搜索的文章讲的并不是很明白。 各种不同的YUV格式其实只是采样方式和存储方式不同,就这两点,不同的采样方式是为了实现节省内存,不同的存储方式暂时不了解有…

2023-02-24:请用go语言调用ffmpeg,解码mp4文件并保存为YUV420SP格式文件,采用YUV420P转YUV420SP的方式。

2023-02-24:请用go语言调用ffmpeg,解码mp4文件并保存为YUV420SP格式文件,采用YUV420P转YUV420SP的方式。 答案2023-02-24: 使用 github.com/moonfdd/ffmpeg-go 库。 解码后就是yuv420p,然后用SwsScale函数转换成yuv…

ffmpeg处理YUV422和YUV420P相互转换

YUV422空间大小计算 YUV422封包width*heightwidth/2*height*2YUYV Y分量width*heightYUYV U分量width/2*heightYUYV V分量width/2*height YUV420空间大小计算 YUV420封包width*heightwidth/2*height/2*2Y分量width*heightU分量width/2*height/2V分量width/2*height/2 extern &…

Android Camera2 YUV420_888 格式详解

Camera2 YUV420_888 官网文档介绍 Android PAI 对 YUV420_888的介绍 ,大致意思如下: 它是YCbCr的泛化格式,能够表示任何4:2:0的平面和半平面格式,每个分量用8 bits 表示。带有这种格式的图像使用3个独立的Buffer表示,每…

【音视频数据数据处理 2】【YUV篇】将YUV420P_I420数据旋转90°-180°-270°-镜像旋转

【音视频数据数据处理 2】【YUV篇】将YUV420P_I420数据旋转90 一、理论分析(以yuv420p_i420格式为例)二、顺时针旋转90 代码实现三、顺时针旋转180 代码实现四、旋转90-180-270-镜像旋转,完整代码实现五、运行结果 本文接着前文: …

YUV420->RGB888格式转换的CPP实现

git地址: GitHub - Evayangelion/EYUVConverter: A YUV converter implemented by cpp 上一次学习了YUV各种采样和存储方式的区别(YUV知识存档) 接下来一起学习一下RGB格式的知识和YUV到RGB的转换方式 RGB色彩模式的分类 RGB的分类相较YUV来说…

YUV444,YUV420P,YUV420SP,YUV422P,YUV422SP,NV12,NV21,NV16,NV61等格式区分与存储简介

一、基础知识: 概述 YUV是顏色編碼方式,常用於視頻及圖像處理中。 其中的YUV是三個分量。“Y”表示明亮度(Luminance或Luma),也就是灰度值。“U”和“V” 表示的是彩色信息,分別爲色度和濃度(C…

OpenGL渲染YUV420P

一 、YUV420P数据格式二 、GLFW渲染YUV420P2.1 定义顶点数据2.2 创建YUV三张纹理2.3上行YUV420数据2.4 渲染纹理2.5 着色器 三、代码地址以及存在的问题四 、解决存在的问题 一 、YUV420P数据格式 图片来源于谷歌 结合上图可以看出YUV420P的特点如下: ①无论在横向还…

详解 YUV 格式(I420/YUV420/NV12/NV12/YUV422)

转载自:划水型派大星 YUV (YCbCr)是一种像素格式,常见于视频编码与静态图像。与 RGB 格式(红-绿-蓝)相反,YUV 分别由一个称为 Y(相当于灰度)的“亮度”分量(…

ffmpeg学习笔记(2)-YUV420算法原理

ffmpeg学习笔记(2)——YUV420算法原理 一、YUV像素格式 YUV的组成格式如下图所示 Y:明亮度,即灰度值 U、V:颜色 YUV格式将亮度信息和色彩信息分离,没有色彩信息依然能够显示图像(没有色彩信息),很好的解…

音视频编解码: YUV存储格式中的YUV420P,YUV420SP,NV12, NV21理解(转)

概述 之前介绍了YUV码流的采样格式,下面分析下YUV码流的存储格式,YUV码流的存储格式与采样格式息息相关。总的来讲,YUV存储格式主要分为两种: planar 平面格式 指先连续存储所有像素点的 Y 分量,然后存储 U 分量&…

图像编码YUV420格式

目录 一、YUV简介 二、RGB 到 YUV 的转换 三、YUV采样 YUV 4:4:4 YUV 4:2:2 YUV 4:2:0 四、YUV 存储格式 基于 YUV 4:2:2 采样的格式 YUYV 格式 UYVY 格式 YUV 422P 格式 基于 YUV 4:2:0 采样的格式 YU12 和 YV12 格式 NV12 和 NV21 格式 一、YUV简介 YUV&#x…

YUV420数据格式详解

YUV简介 YUV格式有两大类:planar和packed。 对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V。 对于packed的YUV格式,每个像素点的Y,U,V是连续交叉存储的。 YUV分为三个分…

python 生产者消费者模式

生产者消费者模式概述 在并发编程中使用生产者和消费者模式能够解决大不多的并发问题。该模式通过平衡生产线程和消费线程的工作能力来提高程序的整体处理数据的速度。 为什么使用生产者消费者模式 在线程世界里,生产者就是生产数据的线程,消费者就是…

生产者-消费者模式

概述 生产者-消费者模式在系统交互方面,有几个特点: 1、系统解耦 2、解决并发问题 3、不需要关心对方系统何时处理数据,处理结果如何 下面用几个简单例子逐步说明。 简单例子 假设有两个系统,A系统和B系统,B系统需要依赖A系统产生的数据,也就是说,A系统产生数据后,必须把数…

生产者消费者模式及简单的运用场景

先考虑一个问题:服务端接受多个客户端提交的视频文件进行转码的操作,应该怎么设计? 由于转码比较花费时间,所以我们排除同步的想法。而转码需要用到的外部软件(exe文件),不能同时被多个线程用到…