[论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms

article/2025/8/19 4:53:50

[论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms

文章目录

  • [论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms
    • 一、总体介绍
    • 二、具体作用
      • 3.1 总体框架
      • 3.3 特征提取网络:M1
      • 3.4 特征提取网络:M2
    • 四、数据及相应结果

一、总体介绍

Looking Outside the Window: Wide-Context Transformer for the Semantic Segmentation of High-Resolution Remote Sensing Images

  远程上下文信息是高分辨率遥感图像语义分割的关键。

  我们提出了一种宽上下文网络(WiCoNet)用于HR RSIs的语义分割,上下文转换器扩展了视觉转换器这一新兴神经网络,用于双分支语义关联的建模。

  提出了一个新的北京土地利用(BLU)数据集。


二、具体作用

在本研究中,目标是同时利用CNN和对transforms HR RSIs进行语义分割,作用在于:

  • cnn善于保存空间信息
  • Transformer则能够更好地建模远程依赖关系

  WiCoNet包括两个cnn,分别从本地和全局图像级别提取特征。这使WiCoNet能够同时考虑本地细节和广域上下文。

  SE块将全局信息聚合并嵌入到特征中,学习不同图像场景中的偏焦点,这在后来的文献中通常被称为通道注意,通道注意和非局部注意块依次用于增强空中rsi中的远程依赖性

Transformer的演变介绍:

  • Transformer最初是为自然语言处理任务引入的,在那里它实现了最先进的性能

  • Pure Transformer可以取代CNN进行图像识别任务

  • Transformer进行密集分类任务,提出了一种用于泛视分割的双路径转换器,其中包括用于分割的像素路径和用于类预测的存储路径


## 三、WiCoNet模型构建

3.1 总体框架

  我们提出了一种WiCoNet,它利用了rsi中更大图像范围中的远程依赖关系

  地分支M1是wiiconet的主要分支,它利用ResNet提取本地特征。WiCoNet中的新设计是一个上下文分支M2,它被引入来显式地对RSIs中的大范围上下文信息建模。它使用一个简单的CNN编码器粗略地学习上下文信息

  并通过context Transformer嵌入到M1中。然后由上下文丰富的M1生成WiCoNet的最终结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V0WsP2lR-1665301339829)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221009145305054.png)]


### 3.2 Context Transformer

  我们引入了一个上下文转换器来将远程上下文信息投射到局部特征上,它是在vit的基础上开发的。典型的ViT采用扁平和投影的图像补丁作为输入。它由多层注意块组成,每层注意块有一个多头自注意单元(MSA)和一个MLP单元

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c9fFRoc6-1665301339829)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221009150022837.png)]

  设计的上下文转换器T的目标是将信息从M2传递到主编码分支M1。我们的目标不是直接添加值,而是投射一个有偏向的焦点来增强M1中的特征。

3.3 特征提取网络:M1

  M1中我们选择ResNet50作为特征提取网络,该网络在利用局部特征[37]方面具有很强的能力。ResNet的下采样步幅为×1/8,以更好地保存空间信息。

  它由11个顺序连接的层组成,包括8个卷积层和3个最大池化层。按照UNet的编码器设计,将每个池化层置于两个卷积层之后

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mU2hd7Hg-1665301339830)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221009150956827.png)]


3.4 特征提取网络:M2

  输入到M2的下采样尺度为×1/4,而上下文编码器的下采样步幅与ResNet (×1/8)相同。上下文窗口的大小被设置为本地窗口大小的9倍.

在这里插入图片描述



[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KlQcP6Lj-1665301339830)(C:\Users\isipa\AppData\Roaming\Typora\typora-user-images\image-20221009151018058.png)]



四、数据及相应结果

  我们提出了一个新的基准数据集——BLU数据集

  我们基于背景/贫瘠、建成区、植被、水、农田和道路六个LU类在采集的图像上构建了细粒度的人类注释

  每张大图被进一步裁剪成64张图像(49张用于训练,7张用于验证,8张用于测试),每张图像都有2048 × 2048像素(图4)。训练、验证和测试区域不重叠,而每个区域内的裁剪窗口有小的重叠。用于训练、验证和测试的图像总数为196张,

训练参数:

  • 训练周期固定为50
  • 批处理大小固定为32
  • 初始学习率固定为0.1。学习率lr在每次迭代时动态计算为:0.1 ∗(1 − iterations/total_iterations)^1.5
  • 优化算法为动量为0.9的随机梯度下降算法。

http://chatgpt.dhexx.cn/article/fZTAO0i5.shtml

相关文章

Python基于改进FCN&VGG的高分辨率遥感图像分割(完整源码&数据集&视频教程)

1.高分辨率遥感图像分割效果展示: 2.数据集简介: 首先介绍一下数据,我们这次采用的数据集是CCF大数据比赛提供的数据(2015年中国南方某城市的高清遥感图像),这是一个小数据集,里面包含了5张带标…

【论文阅读】SCAttNet:具有空间和通道注意机制的高分辨率遥感图像语义分割网络

【论文阅读】SCAttNet:具有空间和通道注意机制的高分辨率遥感图像语义分割网络 文章目录 【论文阅读】SCAttNet:具有空间和通道注意机制的高分辨率遥感图像语义分割网络一、总体介绍二、概述SCAttNet2.1 Segnet网络构建2.2 ResNet50网络构建 三、 注意力机制四、评价指标及相应…

面向对象的高分辨率遥感影像分类实例

一、为什么要使用面向对象 传统的基于像素的遥感影像处理方法都是基于遥感影像光谱信息极其丰富,地物间光谱差异较为明显的基础上进行的。对于只含有较少波段的高分辨率遥感影像,传统的分类方法,就会造成分类精度降低,空间数据的大…

segment anything进行高分辨率遥感影像分割及效果对比

一、SAM模型介绍 Segement Anything Model,简称SAM,是4月初Meta 发布的史上首个图像分割基础模型。它是通过将三个相互关联的元素:Task、Model和Data结合,来构建形成的一个大模型。Task的构成如下图所示,通过输入分割…

高分辨率遥感图像目标检测和场景分类研究进展

本文按照西北工业大学程塨老师的高分辨率遥感图像目标检测和场景分类研究进展汇报进行整理,需要的同学可借此了解遥感图像相关知识~ 高分辨率遥感图像目标检测和场景分类 一、背景介绍1.时间轴2.应用3.图像智能 二、高分辨率遥感图像目标检测研究进展1.任务定义2.难…

深度学习高分辨率遥感影像语义分割

深度学习大家都知道,在计算机视觉领域取得了很大的成功,在遥感影像自动解译方面,同样带来了快速的发展,我在遥感影像自动解译领域,也做了一些微薄的工作,发表几篇论文,我一直关注遥感影像自动解…

FCN全卷积网络模型——高分辨率遥感影像地物识别

FCN全卷积网络模型——高分辨率遥感影像地物识别 这是一篇操作日记 win10与ubuntu的caffe安装过程独立,只是两次不同系统下的演习,真正实验在ubuntu下完成。 操作空间 win10 1:Anaconda 2.0 2:Visual Studio 2013 3:caffe 4:python2.7 Ubuntu 16.04 …

高分辨率遥感影像融合技巧

软件下载地址: https://pan.baidu.com/s/1dt0yDUsAork9LnLnZTwCgw 需要百度网盘下载密码,留言邮箱地址。 或联系联系 QQ:1257396288​ 该软件包含高分辨率遥感影像融合功能(pansharp2),融合效果好&#…

【GIS】高分辨率遥感影像智能解译

1 绪论 随着航空科技工业的不断成熟与发展,我国遥感卫星研制能力不断攀升,发射数量逐年提高,在轨运行的遥感卫星为社会生产及居民日常生活提供了巨大的支持与便利。我国目前同时在轨运行的遥感卫星数量已超过60颗,每天获取并传回…

数据结构学习笔记(四)—— 树

树 文章目录 树一.树的基本概念二.树的遍历1.先序遍历2.后序遍历3.中序遍历4.层序遍历 三.树的存储表示和操作实现1.双亲表示法2.孩子表示法3.双亲孩子表示法4.孩子兄弟表示法 四.树的性质五.二叉树基本概念与定义二叉树的特殊形态——斜树二叉树的特殊形态——满二叉树二叉树的…

sklearn学习(集成算法:随机森林)

随机森林树 一.概述【1】集成算法概述1.概念与应用2.集成算法的目标3.其他定义 【2】sklearn中的集成算法1.sklearn中的集成算法模块ensemble(1)类与类的功能 2.复习:sklearn中的决策树3.sklearn的基本建模流程 二.RandomForestClassifier【1…

数据结构与算法之树(三)AVL树

数据结构与算法之树 数据结构与算法之树(一)二叉树概念及遍历方式(图文并茂) 数据结构与算法之树(二)二叉查找树 数据结构与算法之树(三)AVL树 数据结构与算法之树(四…

C语言数据结构总结:树

树 一,树的定义二,树的基本术语三,二叉树的定义四,二叉树的性质和存储结构五,关于二叉树的算法 一,树的定义 树是n(n>0)个结点的有限集合。 若n0,称为空树。 若n>…

【C++从入门到入土】第二十一篇:二叉搜索树之AVL树

AVL树 文章目录 AVL树一、AVL树1.特点2.操作旋转插入删除查找 一、AVL树 在计算机科学中,AVL树是最先发明的自平衡二叉查找树。在AVL树中任何节点的两个子树的高度最大差别为1,所以它也被称为高度平衡树。增加和删除可能需要通过一次或多次树旋转来重新平…

数据结构--二叉搜索树

二叉搜索树 一丶概念以及特点二丶相关操作定义TreeMap类put()操作--插入节点get()操作--得到key对应的value值getOrDefault()操作containsKey()操作--检查key是否存在containsValue()操作--检查value是否存在remove()操作--删除操作思路(1)叶子结点&…

Java数据结构--树2

Java数据结构--树 一、平衡树1.1 2-3 查找树1.1.1 2-3查找树的定义1.1.2 查找1.1.3 插入1.1.3.1 向2-结点中插入新键1.1.3.2 向一棵只含有一个3-结点的树中插入新键1.1.3.3 向一个父结点为2-结点的3-结点中插入新键1.3.1.4 向一个父结点为3-结点的3-结点中插入新键1.3.1.5 分解…

数据结构之多路查找树

多路查找树 一、2-3树1.1 查找1.2 2-3树的插入实现1.3 2-3树的删除节点 二、2-3-4树三、总结 二叉排序树简单的实现在多数情况能够达到预期的查找效率,但是每个节点只能存储一个元素和只能有两个孩子,使得在大量数据下会造成二叉排序树的深度特别大&…

【数据结构 7】二叉查找树及其Java实现

【数据结构 1】顺序表及其Java实现 【数据结构 2】单向链表及其Java实现 【数据结构 3】双向链表及其Java实现 【数据结构 4】栈及其Java实现 【数据结构 5】队列及其Java实现 【数据结构 6】符号表及其Java实现(使用链表实现) 【数据结构 7】二叉查找树…

C++从入门到精通(第十篇) :二叉搜索树

二叉搜索树 一:二叉搜索树概念二: 二叉搜索树实现节点的定义二叉搜索树实现 三:二叉搜索树的应用四:二叉树有关面试题ps 很多小伙伴为了刷题发愁 今天为大家推荐一款刷题神奇哦:刷题面试神器牛客 各大互联网大厂面试真…

数据结构与算法之树(二)二叉查找树

数据结构与算法之树 数据结构与算法之树(一)二叉树概念及遍历方式(图文并茂) 数据结构与算法之树(二)二叉查找树 数据结构与算法之树(三)AVL树 数据结构与算法之树(四…