图像处理:Hough变换原理分析

article/2025/9/29 7:23:45

目录

一、前言

二、直线函数的形式化表示

2.1 直线被方程表示

2.2 直线被图表表示

2.3 直线的表格表示

三、hough变换的提出

3.1 极坐标表示点和线

四、 hough变换的原理

4.1 极坐标的​编辑表格

 4.2 用​编辑平面表示:过任意点P(x,y)做所有射线,其过原点的垂足点的轨迹

4.3 构建hough算法表格( 在​编辑图)

五、图像处理中,Hough变换如何应用

5.1 python程序代码

5.2 实验和效果1:输入直线图片

5.3 实验效果2:输入一个点


一、前言

        别看Hough变换似乎简单,但是,不发挥一下数学理论的功力是不可能理解的;本人早十几年前就用Hough,也一直想写Hough变换,但一懒就是10几年,乘春节前有空,就将Hough的详细细节揭秘出来,供大家参考。

二、直线函数的形式化表示

        我们常用的二维坐标空间是笛卡尔空间,这一般无需强调;问题是对于同一个事物(比如直线)有无其它表述方式,有,并且很多。

2.1 直线被方程表示

在直角坐标系,任意一条直线的方程是

\begin{equation} \label {eq:someequation} y= kx + b \end{equation} \; \;\;\;\;\;\;( 1 )

2.2 直线被图表表示

在现实图像中,我们可以把等式\begin{equation} \label {eq:someequation} y= kx + b \end{equation}看成一个表格,如图:

2.3 直线的表格表示

以上直线方程构成表格是:

因此,以上用三种方法表示一个直线内容,也就是告诉我们,函数可以以多种方式存在,而计算机算法,常常以表格的方式解决问题为妥。而且从一种表格等价地转换成另一种表格。hough变换就是这样的实例。

三、hough变换的提出

        以上方程,固定k和b,能够找出线上任意一个点,这是一个正向问题;逆向问题是,给出一群点(x,y);问这些点是否构成直线?

        如果试图用计算机解决,那么需要找出某种条件模式,使得所有在直线上的点(x,y)满足这种条件,不在直线的点不满足这个条件。

        这里首先要强调一个事实:r =x\cdot sin\theta + y\cdot cos\theta这个式子有多重含义,如果理解错了,就无法真正懂得houghj变换,本文将逐一讲述该式的三个场景,从而排除干扰,让大家真正懂得hough变换中r =x\cdot sin\theta + y\cdot cos\theta的意义。

3.1 极坐标表示点和线

令一个极坐标系与直角坐标系在原点重合;在极坐标上表示P(x,y)P(r,\theta )

 因此有:y=r sin\theta \;\;\;\;x = rcos\theta

Motion basics: Difference between Cartesian and polar coordinate systems

  r = r(sin^2\theta + cos^2\theta )=rsin\theta\cdot sin\theta +rcos\theta \cdot cos\theta

因此,

r =x\cdot sin\theta + y\cdot cos\theta \;\;\;\;\;\;\;\;\;\;\;\;(2)

注意:以上2)式似乎很明确直观,但是这不是hough的要点。为了追究到底r =x\cdot sin\theta + y\cdot cos\theta是个啥意思,这里专门列出三个意义,比较三个意义之后,才能肯定,哪个解释才是hough的本意。

下面将一一描述。

1)构成点:固定x,y,且tg\theta =y/x;表示直角坐标点P(x,y)和极坐标P(r,\theta )的转换公式:

\left\{\begin{matrix} &r =x\cdot sin\theta + y\cdot cos\theta &(3) \\ &tg\theta =y/x &(4) \end{matrix}\right.

以上(3)和(4)两个条件决定了 直角坐标点P(x,y)和极坐标P(r,\theta )的转换公式。显然,这里我们不是研究单点的,因而这个解释不是hough变换。

2)构成圆轨迹:把P(x,y)的x和y看成固定点,让\theta 随意变动后,r构成圆轨迹

当上面条件(3)和(4)中,去掉(4),单独保留(3)是个啥?提前告诉大家是一个圆轨迹。证明如下:

{\begin{cases} r =x\cdot sin\theta + y\cdot cos\theta \end{cases}(3)}

{\begin{cases} r =\sqrt{x^2+y^2}(\frac{x}{\sqrt{x^2+y^2}}\cdot cos\theta + \tfrac{y}{\sqrt{x^2+y^2}}\cdot sin\theta) & (5) \end{cases} }

令:

{\begin{cases}cos\alpha =\frac{x}{\sqrt{x^2+y^2}} \\ sin\alpha =\frac{y}{\sqrt{x^2+y^2}} \\ {\sqrt{x^2+y^2}}=D \end{cases}}

{\begin{cases} r =D(cos\alpha \cdot cos\theta + sin\alpha \cdot sin\theta) \end{cases} }=D \cdot cos(\theta - \alpha )

此为圆的极坐标方程,如图:

 事实上,从P(x,y)引出的所有直线,都和此圆相交,如图:

结论1:所谓的r =x\cdot sin\theta + y\cdot cos\theta就是给定P(x,y)点后,x和y固定,P与原点O构成线段为直径的圆的轨迹。

推论:过P点的任意直线,与过原点垂线的交点(垂足点),刚好落在圆r =x\cdot sin\theta + y\cdot cos\theta上。

3)构成直线方程:给定任意直线,其到原点距离是固定的、从原点引出垂线方向角也固定

假设,有任意一条直线,如何在极坐标系表示这条直线的轨迹?

         对于任意直线L,做L的垂线,且过原点,垂足为Q(x0,y0);OQ就是原点到L的距离;在直线L上找任意点P(x,y);显然OS=x;PS=y;做OS和PS到OQ的投影,投影线为OR和RQ(=ST),显然OR+ST=OQ;

OQ=OR+ST=xcos\alpha + ysin\alpha \\ r = xcos\cdot\alpha + y\cdot sin\alpha\: \: \: \: \: (7)

结论:公式(7)的意义是,一条直线上所有的点都与一个r和一个\alpha对应,这个解释才是我们这里hough变换所指的意义!

注意:很神奇! r =x\cdot sin\theta + y\cdot cos\theta居然有三种不同含义,以上三个解释全部摆出,经对比,式(7)才是我们要的hough变换的含义。

四、 hough变换的原理

4.1 极坐标的r-\theta表格

        将极坐标的r和\theta以直角方式构建坐标,就成了r-\theta表格平面;直角坐标平面x-y平面的任意点一 一对应于 r-\theta平面的点。

 在r-\theta平面上,\theta坐标是个0-2\pi的有限区间,这是大大的有利条件!!!

 4.2 用r-\theta平面表示:过任意点P(x,y)做所有射线,其过原点的垂足点的轨迹

 如下图,Q1,Q2,Q3,... ... 就是这些射线的原点的垂足点,在 r-\theta表格中表示成正弦曲线,

 上图中的每一个P(x,y)决定一个圆,该圆在 r-\theta平面上对应一条三角曲线(下图)。如果有N个点构成直线,那么,就有N条三角曲线,且交于共同的一个点。

Lines Detection with Hough Transform | by Socret Lee | Towards Data Science

4.3 构建hough算法表格( 在r-\theta图)

1)构建 在r-\theta平面,用矩阵M表示,M初始值赋值为0

2)在图像中选取目标像素的坐标(x,y)

3)在\alpha \ \in [0,2\pi )中取一个序列,从序列中选取一个\alpha带入公式:

          r = xcos\cdot\alpha + y\cdot sin\alpha\: \: \: \: \:

    求出一个r。

4)刷新M矩阵,将对应的M(r,\alpha )值加1.

5)循环完成后,M矩阵的每个峰值对应一条直线。

五、图像处理中,Hough变换如何应用

如果将图片中所有点参与直线提取,是不可取的,因此,需要边缘提取后,然后二值化处理,使得线上点数量规模减小后,用hough变换。

  • 预处理图像,首先边缘提取
  • 然后阈值二值化,将边缘点挑选出来备用。
  • 对边缘点进行hough变换,生成M矩阵
  • 选取M中峰值,将线条对应点提取出。

5.1 python程序代码

# coding=utf-8
import cv2
import numpy as npdef rgb2gray(rgb):return np.dot(rgb[..., :3], [0.299, 0.587, 0.114])Gray = cv2.imread("d:/images/lines1.jpg",0)height,width = Gray.shape
cv2.imshow("dsp",Gray)
cv2.waitKey(0)point ={}
num=0
for i in range(height):for j in range(width):if Gray[i][j] !=0:point[num]=[i,j]num+=1triTable ={}for i in range(180):triTable[i]=[np.sin(i*3.14159/180),np.cos(i*3.14159/180)]len_cross = int( np.sqrt( width**2+ height**2))
MtrScore = np.zeros([len_cross*2,180],np.int32)for i in range(num):ptmp = point[i]for j in range( 180 ):atmp = triTable[j]rou =int( ptmp[0]*atmp[0] + ptmp[1]*atmp[1] ) + len_cross# print(rou)MtrScore[rou][j] = MtrScore[rou][j]+ 1import seaborn as sns
import matplotlib.pyplot as plt
sns.heatmap( MtrScore )
plt.show()

5.2 实验和效果1:输入直线图片

输出的  r-\theta 平面图:

5.3 实验效果2:输入一个点

输入下面图像,图的中部有一个白点,将其进行hough变换,看结果。

输出的  r-\theta 平面图:


http://chatgpt.dhexx.cn/article/bg3kDMf6.shtml

相关文章

Hough变换原理-直线检测

目录 一、简介 二、原理 三、Python代码实现 一、简介 Hough(霍夫)变换是图像处理中从图像中识别几何形状的基本方法之一。Hough变换是将图像坐标空间变换到参数空间,利用点与线的对偶性,将原始图像空间的给定的曲线&#xff08…

YUV444、YUV422、YUV420、YUV420P、YUV420SP、YV12、YU12、NV12、NV21

前言 各种YUV格式多如牛毛啊,刚开始学起来确实很费劲,网上搜索的文章讲的并不是很明白。 各种不同的YUV格式其实只是采样方式和存储方式不同,就这两点,不同的采样方式是为了实现节省内存,不同的存储方式暂时不了解有…

2023-02-24:请用go语言调用ffmpeg,解码mp4文件并保存为YUV420SP格式文件,采用YUV420P转YUV420SP的方式。

2023-02-24:请用go语言调用ffmpeg,解码mp4文件并保存为YUV420SP格式文件,采用YUV420P转YUV420SP的方式。 答案2023-02-24: 使用 github.com/moonfdd/ffmpeg-go 库。 解码后就是yuv420p,然后用SwsScale函数转换成yuv…

ffmpeg处理YUV422和YUV420P相互转换

YUV422空间大小计算 YUV422封包width*heightwidth/2*height*2YUYV Y分量width*heightYUYV U分量width/2*heightYUYV V分量width/2*height YUV420空间大小计算 YUV420封包width*heightwidth/2*height/2*2Y分量width*heightU分量width/2*height/2V分量width/2*height/2 extern &…

Android Camera2 YUV420_888 格式详解

Camera2 YUV420_888 官网文档介绍 Android PAI 对 YUV420_888的介绍 ,大致意思如下: 它是YCbCr的泛化格式,能够表示任何4:2:0的平面和半平面格式,每个分量用8 bits 表示。带有这种格式的图像使用3个独立的Buffer表示,每…

【音视频数据数据处理 2】【YUV篇】将YUV420P_I420数据旋转90°-180°-270°-镜像旋转

【音视频数据数据处理 2】【YUV篇】将YUV420P_I420数据旋转90 一、理论分析(以yuv420p_i420格式为例)二、顺时针旋转90 代码实现三、顺时针旋转180 代码实现四、旋转90-180-270-镜像旋转,完整代码实现五、运行结果 本文接着前文: …

YUV420->RGB888格式转换的CPP实现

git地址: GitHub - Evayangelion/EYUVConverter: A YUV converter implemented by cpp 上一次学习了YUV各种采样和存储方式的区别(YUV知识存档) 接下来一起学习一下RGB格式的知识和YUV到RGB的转换方式 RGB色彩模式的分类 RGB的分类相较YUV来说…

YUV444,YUV420P,YUV420SP,YUV422P,YUV422SP,NV12,NV21,NV16,NV61等格式区分与存储简介

一、基础知识: 概述 YUV是顏色編碼方式,常用於視頻及圖像處理中。 其中的YUV是三個分量。“Y”表示明亮度(Luminance或Luma),也就是灰度值。“U”和“V” 表示的是彩色信息,分別爲色度和濃度(C…

OpenGL渲染YUV420P

一 、YUV420P数据格式二 、GLFW渲染YUV420P2.1 定义顶点数据2.2 创建YUV三张纹理2.3上行YUV420数据2.4 渲染纹理2.5 着色器 三、代码地址以及存在的问题四 、解决存在的问题 一 、YUV420P数据格式 图片来源于谷歌 结合上图可以看出YUV420P的特点如下: ①无论在横向还…

详解 YUV 格式(I420/YUV420/NV12/NV12/YUV422)

转载自:划水型派大星 YUV (YCbCr)是一种像素格式,常见于视频编码与静态图像。与 RGB 格式(红-绿-蓝)相反,YUV 分别由一个称为 Y(相当于灰度)的“亮度”分量(…

ffmpeg学习笔记(2)-YUV420算法原理

ffmpeg学习笔记(2)——YUV420算法原理 一、YUV像素格式 YUV的组成格式如下图所示 Y:明亮度,即灰度值 U、V:颜色 YUV格式将亮度信息和色彩信息分离,没有色彩信息依然能够显示图像(没有色彩信息),很好的解…

音视频编解码: YUV存储格式中的YUV420P,YUV420SP,NV12, NV21理解(转)

概述 之前介绍了YUV码流的采样格式,下面分析下YUV码流的存储格式,YUV码流的存储格式与采样格式息息相关。总的来讲,YUV存储格式主要分为两种: planar 平面格式 指先连续存储所有像素点的 Y 分量,然后存储 U 分量&…

图像编码YUV420格式

目录 一、YUV简介 二、RGB 到 YUV 的转换 三、YUV采样 YUV 4:4:4 YUV 4:2:2 YUV 4:2:0 四、YUV 存储格式 基于 YUV 4:2:2 采样的格式 YUYV 格式 UYVY 格式 YUV 422P 格式 基于 YUV 4:2:0 采样的格式 YU12 和 YV12 格式 NV12 和 NV21 格式 一、YUV简介 YUV&#x…

YUV420数据格式详解

YUV简介 YUV格式有两大类:planar和packed。 对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V。 对于packed的YUV格式,每个像素点的Y,U,V是连续交叉存储的。 YUV分为三个分…

python 生产者消费者模式

生产者消费者模式概述 在并发编程中使用生产者和消费者模式能够解决大不多的并发问题。该模式通过平衡生产线程和消费线程的工作能力来提高程序的整体处理数据的速度。 为什么使用生产者消费者模式 在线程世界里,生产者就是生产数据的线程,消费者就是…

生产者-消费者模式

概述 生产者-消费者模式在系统交互方面,有几个特点: 1、系统解耦 2、解决并发问题 3、不需要关心对方系统何时处理数据,处理结果如何 下面用几个简单例子逐步说明。 简单例子 假设有两个系统,A系统和B系统,B系统需要依赖A系统产生的数据,也就是说,A系统产生数据后,必须把数…

生产者消费者模式及简单的运用场景

先考虑一个问题:服务端接受多个客户端提交的视频文件进行转码的操作,应该怎么设计? 由于转码比较花费时间,所以我们排除同步的想法。而转码需要用到的外部软件(exe文件),不能同时被多个线程用到…

Java多线程系列—生产者消费者模式的多种实现(04)

生产者消费者模式 我们先来看看什么是生产者消费者模式,生产者消费者模式是程序设计中非常常见的一种设计模式,被广泛运用在解耦、消息队列等场景。 在现实世界中,我们把生产商品的一方称为生产者,把消费商品的一方称为消费者,有时生产者的生产速度特别快,但消费者的消…

生产者消费者模式的Java实现

一.概述 1. 什么是“生产者消费者模式”? 生产线程负责生产,消费线程负责消费 生产线程和消费线程要达到均衡。 生产满了就不能继续生产了,必须让消费线程进行消费 消费完了就不能再消费了,必须让生产线程进行生产 这是一种特殊的…

实现生产者消费者模式的三种方式

什么是生产者消费者模式 简单来说,生产者消费者模式就是缓冲区。 那么这么做有两个好处,一个是解耦,第二个是平衡生产能力和消费能力的差,因为生产者和消费者的速度是不一样的,有了这个缓冲区就可以平衡这样一个落差&…