【论文阅读】SCAttNet:具有空间和通道注意机制的高分辨率遥感图像语义分割网络

article/2025/8/19 4:52:22

【论文阅读】SCAttNet:具有空间和通道注意机制的高分辨率遥感图像语义分割网络

文章目录

  • 【论文阅读】SCAttNet:具有空间和通道注意机制的高分辨率遥感图像语义分割网络
    • 一、总体介绍
    • 二、概述SCAttNet
      • 2.1 Segnet网络构建
      • 2.2 ResNet50网络构建
    • 三、 注意力机制
    • 四、评价指标及相应结果

一、总体介绍

处理使用数据集HRRSIs

由于地物的多样性和复杂性,HRRSIs往往表现出较大的类内方差较小的类间方差,这给语义分割任务带来了巨大的挑战。

对比数据集 (ISPRS)Vaihingen和Potsdam数据集

图像语义分割方法:

  • 传统的图像语义分割方法(使用聚类、分类和阈值算法来分割图像)
  • 基于深度学习的图像语义分割方法

本研究采用包含空间注意和通道注意的两个轻量级注意模块对HRRSIs进行语义分割

二、概述SCAttNet

它由两个部分组成:特征提取主干模块和注意模块

遥感图像,首先利用骨干网进行特征提取

提取出来的特征图输入到信道注意模块中,对通道中的特征进行细化

将优化后的通道特征图输入空间注意模块,在空间轴上进行细化

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YuvtwUXG-1665300912929)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005224141067.png)]

特征提取骨干

使用了两个具有代表性的主干进行特征提取:SegNet和ResNet50

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WZpML6dG-1665300912930)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005230040239.png)]

特征提取:

  • 以SegNet为骨干的SCAttNet V1
  • 以ResNet50为骨干的SCAttNet V2

ResNet50可以构建具有广泛接受域的深层模型(ResNet50使用了8次下采样)

2.1 Segnet网络构建

SegNet和FCN思路十分相似,只是Encoder,Decoder(Upsampling)使用的技术不一致。此外SegNet的编码器部分使用的是VGG16的前13层卷积网络,每个编码器层都对应一个解码器层

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AQhwff4H-1665300912930)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005233735782.png)]

在每次下采样和上采样的过程中,都会保留相应的坐标位置

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1mekr3w7-1665300912931)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005234017676.png)]

2.2 ResNet50网络构建

ResNet的各种网络结构图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vZOlBfmF-1665300912931)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005234805781.png)]

ResNet-50经过了4个Block,每一个Block中分别有3,4,6,3个Bottleneck

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZwZV5BIh-1665300912931)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005234922330.png)]

三、 注意力机制

(1)通道注意力

通道注意力的目的是利用特征图中各通道之间的关系来学习一个一维权值Wc∈R^(C×1×1),然后将其乘以对应的通道

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2RnMYgAR-1665300912932)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005225954943.png)]

The formula for calculating channel attention is shown in Formula 1(注意力通道的计算公式):

在这里插入图片描述

(2)空间注意力

空间注意力它关注的是当前任务有价值的地方,利用空间注意对聚集空间信息是有用的,特别是对小型地物

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fMU0LRlm-1665300912932)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005230017869.png)]

具体使用方法:

  1. 通过全局平均池全局最大池操作为每个空间位置生成两个特征描述图

  2. 将两个特征描述图连接在一起,通过7 × 7卷积运算生成空间注意图

  3. 使用sigmoid函数将空间特征地图缩放到0 ~ 1

The spatial attention calculation formula is shown in Formula (空间注意力计算公式):

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ODivTc5W-1665300912933)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005225653599.png)]

需要注意的部分存在:

  • 其中通道注意模块的参数个数为C × C/4(C为通道个数)
  • 空间注意模块的参数个数和为98
  • 我们只在骨干网的端层增加了注意模块
  • 采用Woo的方法来整合两个注意模块

四、评价指标及相应结果

用了三个评估指标,来评估语义分割性能分别是:

  • mean inter-section over union(MIoU)
  • average F1-score (AF)
  • 总体精度overall accuracy (OA)

随机裁剪,得到27000个256 × 256的patch用于训练

Training all the model from the scratch without bells and whistles

(从头开始训练所有的模型,没有花哨的修饰)

使用的对比模型:

  • fc -32s(FCN)、fc -8s、Unet、SegNet和G-FRNet等型号均采用VGG-16作为骨干

  • RefineNet进行32次下采样,ResNet50作为骨干

  • DeepLabv3+进行8次下采样,ResNet50作为骨干

训练参数:

  • SCAttNet V1在Vaihingen和Potsdam数据集上的学习率分别设置为1e-3和1e-4
  • SCAttNet V2的学习率设置为1e-3
  • Adam作为优化器
  • 交叉熵作为损失函数
  • 训练时间设定为50 epoch
  • batch size 为 16

第一行展示了ISPRS Vaihingen数据集的可视化结果,从左到右依次为:原始图像、SegNet输出结果、SCAttNet V1输出结果和地面真相

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cib1t3NW-1665300912933)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221005232850000.png)]


http://chatgpt.dhexx.cn/article/y0KddN33.shtml

相关文章

面向对象的高分辨率遥感影像分类实例

一、为什么要使用面向对象 传统的基于像素的遥感影像处理方法都是基于遥感影像光谱信息极其丰富,地物间光谱差异较为明显的基础上进行的。对于只含有较少波段的高分辨率遥感影像,传统的分类方法,就会造成分类精度降低,空间数据的大…

segment anything进行高分辨率遥感影像分割及效果对比

一、SAM模型介绍 Segement Anything Model,简称SAM,是4月初Meta 发布的史上首个图像分割基础模型。它是通过将三个相互关联的元素:Task、Model和Data结合,来构建形成的一个大模型。Task的构成如下图所示,通过输入分割…

高分辨率遥感图像目标检测和场景分类研究进展

本文按照西北工业大学程塨老师的高分辨率遥感图像目标检测和场景分类研究进展汇报进行整理,需要的同学可借此了解遥感图像相关知识~ 高分辨率遥感图像目标检测和场景分类 一、背景介绍1.时间轴2.应用3.图像智能 二、高分辨率遥感图像目标检测研究进展1.任务定义2.难…

深度学习高分辨率遥感影像语义分割

深度学习大家都知道,在计算机视觉领域取得了很大的成功,在遥感影像自动解译方面,同样带来了快速的发展,我在遥感影像自动解译领域,也做了一些微薄的工作,发表几篇论文,我一直关注遥感影像自动解…

FCN全卷积网络模型——高分辨率遥感影像地物识别

FCN全卷积网络模型——高分辨率遥感影像地物识别 这是一篇操作日记 win10与ubuntu的caffe安装过程独立,只是两次不同系统下的演习,真正实验在ubuntu下完成。 操作空间 win10 1:Anaconda 2.0 2:Visual Studio 2013 3:caffe 4:python2.7 Ubuntu 16.04 …

高分辨率遥感影像融合技巧

软件下载地址: https://pan.baidu.com/s/1dt0yDUsAork9LnLnZTwCgw 需要百度网盘下载密码,留言邮箱地址。 或联系联系 QQ:1257396288​ 该软件包含高分辨率遥感影像融合功能(pansharp2),融合效果好&#…

【GIS】高分辨率遥感影像智能解译

1 绪论 随着航空科技工业的不断成熟与发展,我国遥感卫星研制能力不断攀升,发射数量逐年提高,在轨运行的遥感卫星为社会生产及居民日常生活提供了巨大的支持与便利。我国目前同时在轨运行的遥感卫星数量已超过60颗,每天获取并传回…

数据结构学习笔记(四)—— 树

树 文章目录 树一.树的基本概念二.树的遍历1.先序遍历2.后序遍历3.中序遍历4.层序遍历 三.树的存储表示和操作实现1.双亲表示法2.孩子表示法3.双亲孩子表示法4.孩子兄弟表示法 四.树的性质五.二叉树基本概念与定义二叉树的特殊形态——斜树二叉树的特殊形态——满二叉树二叉树的…

sklearn学习(集成算法:随机森林)

随机森林树 一.概述【1】集成算法概述1.概念与应用2.集成算法的目标3.其他定义 【2】sklearn中的集成算法1.sklearn中的集成算法模块ensemble(1)类与类的功能 2.复习:sklearn中的决策树3.sklearn的基本建模流程 二.RandomForestClassifier【1…

数据结构与算法之树(三)AVL树

数据结构与算法之树 数据结构与算法之树(一)二叉树概念及遍历方式(图文并茂) 数据结构与算法之树(二)二叉查找树 数据结构与算法之树(三)AVL树 数据结构与算法之树(四…

C语言数据结构总结:树

树 一,树的定义二,树的基本术语三,二叉树的定义四,二叉树的性质和存储结构五,关于二叉树的算法 一,树的定义 树是n(n>0)个结点的有限集合。 若n0,称为空树。 若n>…

【C++从入门到入土】第二十一篇:二叉搜索树之AVL树

AVL树 文章目录 AVL树一、AVL树1.特点2.操作旋转插入删除查找 一、AVL树 在计算机科学中,AVL树是最先发明的自平衡二叉查找树。在AVL树中任何节点的两个子树的高度最大差别为1,所以它也被称为高度平衡树。增加和删除可能需要通过一次或多次树旋转来重新平…

数据结构--二叉搜索树

二叉搜索树 一丶概念以及特点二丶相关操作定义TreeMap类put()操作--插入节点get()操作--得到key对应的value值getOrDefault()操作containsKey()操作--检查key是否存在containsValue()操作--检查value是否存在remove()操作--删除操作思路(1)叶子结点&…

Java数据结构--树2

Java数据结构--树 一、平衡树1.1 2-3 查找树1.1.1 2-3查找树的定义1.1.2 查找1.1.3 插入1.1.3.1 向2-结点中插入新键1.1.3.2 向一棵只含有一个3-结点的树中插入新键1.1.3.3 向一个父结点为2-结点的3-结点中插入新键1.3.1.4 向一个父结点为3-结点的3-结点中插入新键1.3.1.5 分解…

数据结构之多路查找树

多路查找树 一、2-3树1.1 查找1.2 2-3树的插入实现1.3 2-3树的删除节点 二、2-3-4树三、总结 二叉排序树简单的实现在多数情况能够达到预期的查找效率,但是每个节点只能存储一个元素和只能有两个孩子,使得在大量数据下会造成二叉排序树的深度特别大&…

【数据结构 7】二叉查找树及其Java实现

【数据结构 1】顺序表及其Java实现 【数据结构 2】单向链表及其Java实现 【数据结构 3】双向链表及其Java实现 【数据结构 4】栈及其Java实现 【数据结构 5】队列及其Java实现 【数据结构 6】符号表及其Java实现(使用链表实现) 【数据结构 7】二叉查找树…

C++从入门到精通(第十篇) :二叉搜索树

二叉搜索树 一:二叉搜索树概念二: 二叉搜索树实现节点的定义二叉搜索树实现 三:二叉搜索树的应用四:二叉树有关面试题ps 很多小伙伴为了刷题发愁 今天为大家推荐一款刷题神奇哦:刷题面试神器牛客 各大互联网大厂面试真…

数据结构与算法之树(二)二叉查找树

数据结构与算法之树 数据结构与算法之树(一)二叉树概念及遍历方式(图文并茂) 数据结构与算法之树(二)二叉查找树 数据结构与算法之树(三)AVL树 数据结构与算法之树(四…

【算法修炼】二叉搜索树

学习自:https://labuladong.gitee.io/algo/2/19/26/ 二叉搜索树 一、BST的中序遍历230、二叉搜索树中第k小的元素(中等)1038、从二叉搜索树到更大和树(中等) 二、判断BST的合法性※98、验证二叉搜索树(中等…

数据结构(C语言)-树

树 一、树1、树的定义2、树的基本术语3、树结构和线性结构的比较 二、二叉树1、二叉树的定义2、二叉树的形态与树的形态3、二叉树的性质4 、二叉树的存储结构5、遍历二叉树6、二叉树的其他操作7、线索二叉树 三、树与二叉树的转换1、树转换成二叉树2、二叉树变树 四、哈夫曼树1…