image features extraction

article/2025/9/14 17:03:26

目录

一.概述

二.图像的边缘特征及其检测方法

1.图像的边缘特征

 2.梯度边缘检测

(1)原理

(2)Roberts算子

 (3)Sobel算子

(4)Prewitt算子

3.二阶微分边缘检测

4.Marr边缘检测算法

三.图像的点与角点特征及其检测方法

1.概念

四.图像的纹理特征及其描述和提取方法

1.概述

(1)纹理的概念

2.图像纹理特征描述与提取方法

(1)统计分析法

 (2)结构分析法

(3)模型分析法

 (4)频谱分析法

五.图像的统计特征

1.图像的均值

2.图像的方差

3.图像的标准差

4.图像的熵

(1)一维熵

(2)二维熵


一.概述

图像领域的许多应用中,人们总是希望从分割出的区域中分辨出地物类别,例如分辨农田、森林、湖泊、沙滩等;或是希望从分割出的区域中识别出某种物体(目标),例如在河流中识别舰船;在飞机跑道上识别飞机等。进行地物分类和物体识别的第一步就是物体特征的提取和检测,然后才能根据检测和提取的图像特征对图像中可能的物体进行识别。

图像特征是用于区分一个图像内部特征的最基本的属性。图像特征可分成自然特征和人工特征两大类。

人工特征是指人们为了便于对图像进行处理和分析而人为认定的图像特征,比如图像直方图、图像频谱和图像的各种统计特征(图像的均值、图像的方差、图像的标准差、图像的熵)等。

自然特征是指图像固有的特征,比如图像中的边缘、角点、纹理、形状和颜色等。

二.图像的边缘特征及其检测方法

1.图像的边缘特征

图像边缘具有方向和幅度两个特征。沿边缘走向,像素的灰度值变化比较平缓,而沿垂直于边缘的走向,像素的灰度值则变化比较剧烈。这种剧烈的变化或者呈阶跃状(step edge),或者呈屋顶状(roof edge),分别称为阶跃状边缘和屋顶状边缘。
一般常用一阶和二阶导数来描述和检测边缘。

(白:255)

          图10.1  图像边缘及其导数曲线规律示例

图像中的边缘可以通过对它们求导数来确定,而导数可利用微分算子来计算。对于数字图像来说,通常是利用差分来近似微分。

 2.梯度边缘检测

(1)原理

从梯度原理出发,已经发展了许多边缘检测算子,下面是三种最典型的边缘检测算子。

(2)Roberts算子

 利用Roberts边缘检测算子进行边缘检测的方法是:分别利用上述两个模板对图像进行逐像素卷积,将2 个卷积结果值相加,然后判别该相加结果是否大于或等于某个阈值,如果满足条件,则将其作为结果图像中对应于模板(i,j)位置的像素值;如果不满足条件,则给结果图像中对应于模板(i,j)位置的像素赋0 值。

 由于Roberts边缘检测算子是利用图像的两个对角线方向的相邻像素之差进行梯度幅值的检测,所以求得的是在差分点(i+1/2,j+1/2)处梯度幅值的近似值,而不是所预期的点(i,j)处的近似值,为了避免引起混淆,可采用3×3邻域计算梯度值。

 (3)Sobel算子

利用Sobel边缘检测算子进行边缘检测的方法是:分别利用上述两个模板对图像进行逐像素卷积,将2个卷积结果值相加,然后判别该相加结果是否大于或等于某个阈值,如果满足条件,则将其作为结果图像中对应于模板中心位置(i,j)处的像素值;如果不满足条件,则给结果图像中对应于模板中心位置(i,j)处的像素赋0 值。

Sobel边缘检测算子在较好地获得边缘效果的同时,并对噪声具有一定的平滑作用,减小了对噪声的敏感性。但Sobel边缘检测算子检测的边缘比较粗,也即会检测出一些伪边缘,所以边缘检测精度比较低。

(4)Prewitt算子

Prewitt算子的计算显然比Sobel算子更为简单,但在噪声抑止方面Sobel算子比Prewitt算子略胜一筹。
需要强调的是,从总体上来说,梯度算子对噪声都有一定的敏感性,所以比较适用于图像边缘灰度值比较尖锐,且图像中噪声比较小的情况下应用。

3.二阶微分边缘检测

一阶导数的边缘检测算子边缘检测时,有时会出现因检测到的边缘点过多而导致边缘(线)过粗的情况。
通过去除一阶导数中的非局部最大值就可以检测出更细的边缘,而一阶导数的局部最大值对应着二阶导数的零交叉点。
所以通过找图像的二阶导数的零交叉点就能找到精确的边缘点。

       图10.3  Laplacian二阶边缘检测算子的边缘检测示例

4.Marr边缘检测算法

为了克服了一般微分运算对噪声敏感的缺点, Marr边缘检测算法利用能够反映人眼视觉特性的LOG算子对图像进行检测,并结合二阶导数零交叉的性质对边缘进行定位,在图像边缘检测方面得到了较好应用。

在实际应用中,LOG算子一般取5×5的模板。

三.图像的点与角点特征及其检测方法

1.概念

对图像中的点特征的提取最基本的方法是模板匹配方法,常用的点特征提取与检测模板如图10.7所示。

图10.7  图像的点特征提取模板

角点检测方法大体可以分为三类:
        1)基于模板的角点检测算法;
        2)基于边缘的角点检测算法;
        3)基于图像灰度变化的角点检测算法(应用最广泛)

SUSAN算法待补

四.图像的纹理特征及其描述和提取方法

1.概述

纹理通常被用来描述物体的表面特征,诸如地形、植被、沙滩、砖墙、岩石、纺织布料、毛质、皮质、墙纸、各种台面等。
纹理是一种十分重要的图像特征,它不仅反映了图像的灰度统计信息,而且反映了图像的空间分布信息和结构信息,在模式识别、图像分割与识别、计算机视觉中具有广泛的应用前景。

(1)纹理的概念

在图像中,由某种模式重复排列所形成的结构可看作是纹理。图像纹理反映了物体表面颜色和灰度的某种变化,而这些变化又与物体本身的属性相关。
     从宏观上看,纹理是物体表面拓扑逻辑的一种变化模式;从微观上看,它由具有一定的不变性的视觉基元(通称纹理基元)组成。不同物体表面的纹理可作为描述不同区域的一种明显特征。

 纹理的特征有三点:
    (1)某种局部的序列性在比该序列更大的区域内不断重复出现。也即纹理是按一定的规则对纹理基元进行排列所形成的重复模式1。
    (2)序列由基本的纹理基元非随机排列组成。也即纹理是由纹理基元按某种确定性的或统计性的规律排列2而成的一种结构。
    (3)在纹理区域内各部分具有大致相同的结构和尺寸。以对应区域具有较为恒定的纹理特征的图像为例,则图像函数的一组局部属性具有是恒定的,或者是缓变的,或者是近似周期性3的特征。

几个具有代表性的图像纹理定义:
定义10.1  纹理是一种反映图像中同质现象的视觉特征,体现了物体表面共有的内在属性,包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系。

定义10.2  如果图像内区域的局域统计特征或其他一些图像的局域属性变化缓慢或呈近似周期性变化,则可称为纹理。
定义10.3  纹理就是指在图像中反复出现的局部模式和它们的排列规则。

定义10.4  纹理被定义为一个区域属性,区域内的成分不能进行枚举,且成分之间的相互关系不十分明确。
定义10.5  纹理是一种反映像素的空间分布属性的图像特征,通常表现为局部不规则而宏观有规律的特性。
定义10.6  纹理具有三大标志:某种局部序列性不断重复、非随机排列和纹理区域内大致为均匀的统一体。

2.图像纹理特征描述与提取方法

(1)统计分析法

基于统计纹理特征的检测方法,主要包括灰度直方图法1、灰度共生矩阵法、灰度行程长度法、灰度差分统计、交叉对角矩阵、自相关函数法等。
    根据统计分布,计算像素的局部特征分析纹理的灰度级的空间分布。统计分析法对木纹、沙地、草地这种完全无法判断结构要素和规则的图像的分析很有效。
    方法简单、易于实现,尤其是灰度共生矩阵法是公认的有效方法。

 (2)结构分析法

纹理基元几乎具有规范的关系,因而假设纹理图像的基元可以分离出来, 并以基元的特征和排列规则进行纹理分割。
    该方法根据图像纹理小区域内的特点和它们之间的空间排列关系,以及偏心度、面积、方向、矩、延伸度、欧拉数、幅度周长等特征分析图像的纹理基元的形状和排列分布特点,目的是获取结构特征和描述排列的规则。结构分析法主要应用于已知基元的情况,对纤维、砖墙这种结构要素和规则都比较明确的图像分析比较有效。

(3)模型分析法

每个像素和其邻域像素存在的某种相互关系及平均亮度为图像中各个像素点建立模型,然后由不同的模型提取不同的特征量,也即进行参数估计。
    典型的模型分析法有自回归方法、马尔可夫随机场方法和分形方法等.

 (4)频谱分析法

频谱分析方法又称为信号处理法和滤波方法。该方法是将纹理图像从空间域变换到频率域,然后通过计算峰值处的面积、峰值与原点的距离平方、峰值处的相位、两个峰值间的相角差等,来获得在空间域不易获得的纹理特征,如周期、功率谱信息等。
    典型的谱分析法有二维傅立叶(变换)滤波方法、Gabor(变换)滤波变换和小波方法等。

基于结构方法的纹理描述:

结构方法是利用一定的语法规则对纹理的结构进行描述的方法。基本思想是:复杂的纹理结构可以在纹理图元的基础上,借助一些限制图元和排列规则得到。

基于频谱方法的纹理描述:

频谱方法是利用傅立叶频谱对纹理进行描述的方法,它适用于描述图像中的具有一定周期性或近似周期性的纹理,它可以分辨出二维纹理模式的方向性,而这是用空间检测方法难以得到的。

 利用频谱方法描述纹理主要用到傅立叶频谱的3个特性:
(1)频谱中突起的尖峰对应纹理模式的主要方向;
(2)频率平面中尖峰的位置对应纹理模式的基本周期;
(3)将周期性成分滤除后,余下的非周期性成分可以用统计方法描述。

五.图像的统计特征

根据概率统计知识可知,图像像素的均值等主要反映了图像中像素的集中趋势,图像像素的方差和标准差主要反映了图像中像素的离中趋势,图像的熵主要反映了图像中平均信息量的多少。

1.图像的均值

2.图像的方差

3.图像的标准差

4.图像的熵

(1)一维熵

(2)二维熵

统计特征代码如下(二维熵没写,indolent):

import cv2 as cv
import numpy as npsrc=cv.imread('/home/image/Pictures/lena300.jpg',0)
(H,W)=src.shape#statistic feature
mean=cv.meanStdDev(src)#返回两个二维数组,第一个存放平均值,第二个存放标准差
print('均值:',mean[0][0,0],'标准差:',mean[1][0,0])
#mean=np.mean(src)#均值
#std=np.std(src)#标准差
var=np.var(src)#方差
print('方差:',var)
#entropy熵
p=[0]*256
for i in range(H):for j in range(W):p[src[i,j]]+=1
M=H*W
sum=0
for i in range(256):p[i]/=Mif p[i]!=0:sum+=p[i]*np.log(p[i])
entropy=-sum
print('一维熵:',entropy)

在求熵时,遇到了除0错误,想到p[i]中肯定有0,而log的定义域是大于0的,故而错误。

可以这么理解,当p[i]为0的看作是趋于0,一个重要极限你懂的x->0时,lim xlnx=0,所以p[i]直接跳过就好啦!


http://chatgpt.dhexx.cn/article/Alaocsek.shtml

相关文章

Imagen 怎么工作的

原始英文链接: How Imagen Actually Works 字幕被输入到一个预训练和冻结的 Transformer 编码器中,该编码器输出一个向量序列(文本编码)。这些向量很重要,因为它们对标题中的单词如何相互关联进行编码,并充当模型所有…

image格式处理

图片三种访问方式: 1. 返回的是图片url字符串 src“http://xxxxx.jpg” 2. 返回的是图片类型的文件流 返回contentType的是image/png类型的,就new Blob对象,然后取blob对象中的url,图片上传组件选取本地图片能显示图片用的是该原理 3. 返回的…

如何制作9.png图片

什么是9.png图片: .9.PNG是安卓开发里面的一种特殊的图片,这种格式的图片通过ADT自带的编辑工具生成,使用九宫格切分的方法,使图片支持在android 环境下的自适应展示。 9.png图片如何优势: (1)允…

9.png图片的处理

1. PNG格式。 在这里不过多的讨论PNG格式的定义问题。但是.9.PNG确实是标准的PNG格式,只是在最外面一圈额外增加1px的边框,这个1px的边框就是用来定义图片中可扩展的和静态不变的区域。特别说明,left和top边框中交叉部分是可拉伸部分&#xf…

如何在线压缩png图片?png压缩图片大小的方法介绍

压缩PNG图片大小的优点 随着数字化时代的发展,PNG格式已成为一种常见的图片格式。然而,由于高分辨率、高色深等原因,PNG图片通常具有较大的文件体积,导致在传输、存储和网页加载等方面会产生不必要的负担。因此,对于需…

InternImage

终于有对抗Transformer 的了~~ 来自浦江实验室、清华等机构的研究人员提出了一种新的基于卷积的基础模型,称为 InternImage,与基于 Transformer 的网络不同,InternImage 以可变形卷积作为核心算子,使模型不仅具有检测和分割等下游…

图片<img>

图像标签演示源代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>图像标签</title> </…

拉伸图片的两种方法

在开发时&#xff0c;常常会遇到一个图片作为控件的image显示时&#xff0c;图片太小&#xff0c;此时图片被拉伸后,图片四周显示的并不是我们想要的结果&#xff0c;此时我们就需要对图片进行拉伸操作&#xff0c;有两种方法可以去拉伸图片&#xff0c; 一种是进入资产文件夹中…

css控制图片拉伸不变形,css+background实现 图片宽高自适应,拉伸裁剪不变形

图片宽高不固定 &#xff0c;一样实现自适应&#xff0c;拉伸裁剪不变形&#xff0c;适应各大兼容性。 下面咱们在网上找两张宽高不一样的照片&#xff1a; No.1 No.2 从上图看一个宽的一个窄的&#xff0c;很难做到自适应&#…

html背景图片 纵向拉伸,背景图片拉伸(CSS方法)_html/css_WEB-ITnose

在布局现在的网站首页的时候&#xff0c;发现一个问题。我使用了一张1440*900的png图片作为背景图片。页面内的Div使用了较多的百分比自适应框体大小&#xff0c;原body元素的CSS如下 html { width: 100%; height: 100%;}body { background: url(../img/bg.png) no-repeat; mar…

ios图片局部拉伸

转载自http://justsee.iteye.com/blog/1973358 下面张图片&#xff0c;本来是设计来做按钮背景的&#xff1a; button.png&#xff0c;尺寸为&#xff1a;24x60 现在我们把它用作为按钮背景&#xff0c;按钮尺寸是150x50&#xff1a; C代码 // 得到view的尺寸 CGSize viewS…

Qt部分拉伸的背景图片

目录 引言代码实现 引言 QSS是Qt客户端开发中非常重要的一环&#xff0c;也是非常容易被忽略的一环。因为网上有太多的博文直接给出了相对美观的样式&#xff0c;导致多数人只是将样式表拷贝使用&#xff0c;而没有细究其中的语法。这也是我在面试时分辨Qt界面开发经验的重要标…

android 九宫格 拉伸,CAScale9ImageView(九宫格图片拉伸)

类说明 CAScale9ImageView是CrossApp提供的一种九宫格拉伸图片的解决方案,我们先来了解一下什么是九宫格图片拉伸。 在App的设计过程中,为了适配不同的手机分辨率,图片大小需要拉伸或者压缩,这样就出现了可以任意调整大小的拉伸样式。 CAScale9ImageView 属性(点击方法名可…

Android自适应拉伸图片

这篇文章是android开发人员的必备知识&#xff0c;内容摘选自网络&#xff0c;友我为大家整理和总结&#xff0c;不求完美&#xff0c;但是有用。 视频教程地址&#xff1a;http://player.youku.com/player.php/sid/XMTMwODc3Njc2/v.swf 1.背景自适应且不失真问题的存在 制作自…

android 图片自动拉伸,解决关于ImageView自适应的问题(拉伸变形,图片模糊)

今天接手一个项目发现有个地方的图片显示非常小&#xff0c;而且还不够清晰&#xff0c;也没办法自适应屏幕的显示&#xff0c;非常的影响美观&#xff0c;于是 就像这优化一下。 先看看优化前的效果和优化后的效果。 修复后 修复前 布局文件修复前&#xff1a; 修复前 布局文件…

html背景图片纵向拉伸,html网页背景图片拉伸 关于html背景图片往下拉伸问题

html 如何让背景图片充满全图&#xff0c;就是拉伸 html语言背景图片拉伸代码&#xff1a;background-size:cover&#xff0c;可以使图片拉伸铺满背景。 拓展资料 背景 (background) 属性定义元素的背景效果 元素的背景区包括前景之下直到边框边界的所有空间。因此&#xff0c;…

android 拉伸图片

Android拉伸图片用的是9.png格式的图片&#xff0c;这种图片可以指定图片的那一部分拉伸&#xff0c;那一部分显示内容&#xff0c;美工给的小图片也能有很好的显示效果。 原背景图片 可以看到原背景图片很小&#xff0c;即使在再长的文字&#xff0c;背景图片的圆角也不会拉伸…

html js 修改img 图片不拉伸,防止图片拉伸的自适应处理

在web开发中,作为前端经常会遇到处理图片拉伸问题的情况。 例如banner、图文列表、头像等所有和用户或客户自主操作图片上传的地方, 而一旦牵扯图片,就会涉及到图片拉伸的问题, 当然,在图片上传时做手动裁切,让用户或客户清晰的感知到图片的有效内容才是最优的解决方案,…

html平铺 拉伸 图片,[CSS]背景图片中平铺与拉伸

在某业务场景下,需要支持背景图的平铺和拉伸,那么在CSS中的这俩属性表现有何区分关系到是否符合业务表现,因此有必要清晰知道其差别。 原本以为只有自己会遇到,没想到群里有小伙伴也问到了。 0x00 background-size 在CSS中有background-size属性,平铺与拉伸可以通过下面两…