概述DeepLab系列(deeplab v1, deeplab v2, deeplab v3, deeplab v3+)

article/2025/10/23 17:28:32

前言:图像分割是指像素级别的图像识别,即标注出图像中每个像素所属的对象类别。
语义分割更注重类别之间的区分,而实例分割更注重个体之间的区别。

DeepLab是由Google团队提出的一系列图像分割算法。

DeepLab v1 (2014年)

Paper (ICLR 2015)
Code
在这里插入图片描述

创新点:

  1. 空洞卷积(Atrous Conv);
    <解决编码过程中信号不断被下采样,细节丢失的问题>
  2. 全连接条件随机场(Fully-connected Conditional Random Field)。
    <由于conv层提取的特征具有平移不变性,这就限制了定位精度。因此引入全连接CRF来提高模型捕获结构信息的能力,解决精分割问题。>

CRF 意在给相邻的像素进行建模,相近的像素更可能是同一个 label,定义每个像素属于某个 label 的概率,通过迭代来优化结果。Fully connected CRF避免了使用short-range CRF带来的平滑效果。

在这里插入图片描述

DeepLab v2

Paper(TPAMI 2017)

与v1不同点:

  1. 空洞空间金字塔池化 ASPP(Atrous spatial pyramid pooling )
  2. 将v1使用的backbone VGG16替换成了 Resnet101

在这里插入图片描述
ASPP可用于解决不同检测目标大小差异的问题:通过在给定的特征层上使用不同dilation的空洞卷积,可以有效的进行重采样。构建不同感受野的卷积核,用来获取多尺度物体信息。

在这里插入图片描述

DeepLab v3

Paper

主要创新点就是改进v2的ASPP模块,一个1×1的卷积和3个3×3的空洞卷积,每个卷积核有256个且都有BN层,包含图像及特征(全局平均池化)。

在这里插入图片描述

  1. 加入了BN层;
  2. 将v2中的ASPP中尺寸3×3,dilation=24的空洞卷积替换成一个普通的1×1卷积,以保留滤波器中间部分的有效权重;(随着空洞率的增大,滤波器中有效权重的个数在减少)
  3. 增加了全局平均池化以便更好的捕捉全局信息。

authors将解决多尺度物体问题的方法分成四类:
在这里插入图片描述
(a) 图像金字塔-----把输入图片缩放成不同尺度,经过同一个网络,最终融合多尺度下的物体信息
(b)编码解码----编码器的高层次的特征容易捕获更长的距离信息,在解码器阶段使用编码器阶段的信息帮助恢复目标的细节和空间维度
(c)在原网络最后层增加额外的context模块,如DenseCRF,或者串联几个不同感受野的卷积模块
(d)空间金字塔池化----采用空间金字塔池化可以捕获多个层次的上下文

在这里插入图片描述

DeepLab v3+

主要工作:

  1. 将原DeepLabv3当作encoder,添加decoder得到新的模型(DeepLab v3+);把spatial pyramid pooling module和Encoder-Decoder融合成一体:
    在这里插入图片描述
  2. modify xception作为backbone----把Xception和Depthwise separable convolution应用到Atrous Spatial Pyramid Pooling和decoder中。

在这里插入图片描述

修改点:
更深的Xception结构,并不修改entry flow network结构
所有的max pooling结构被stride=2的深度可分离卷积代替
每个3x3的depthwise convolution都跟BN和Relu

整体网络结构:

在这里插入图片描述

参考:

  1. 很细致的blog deeplab系列总结(deeplab v1& v2 & v3 & v3+)
  2. 简书: DeepLab系列之V1
  3. 知乎 深度学习|语义分割:DeepLab系列
  4. 官方PPT

http://chatgpt.dhexx.cn/article/1L8g9egA.shtml

相关文章

DeepLab系列理解

原文Blog&#xff1a;https://zhuanlan.zhihu.com/p/61208558 1、deeplab v1 针对标准的深度卷积神经网络的两个主要问题&#xff1a;1.Striding操作使得输出尺寸减小&#xff1b; 2.Pooling对输入小变化的不变性&#xff0c;v1 使用空洞卷积(atrous)条件随机场(CRFs)来解决这…

Deep Lab 系列总结

Deep Lab v1 结合了深度卷积神经网络&#xff08;DCNNs&#xff09;和概率图模型&#xff08;Dense CRFs&#xff09;的方法 问题1&#xff1a;DCNN s做语义分割时精准度不够&#xff0c;根本原因是DCNNs的高级特征的平移不变性&#xff0c;即高层次特征映射&#xff0c;根…

DeepLab V3+:DeepLab系列的极致?

这篇文章提交在arXiv上的&#xff0c;对应代码也已经开源。 理解DeepLab V3的构架首先需要理解DeepLab V3&#xff08;可以参考博主的前一篇博客&#xff09;&#xff0c;V3基本上可以理解成在原始的基础上增加了encoder-decoder模块&#xff0c;进一步保护物体的边缘细节信息…

【Deep Learning】DeepLab

【论文】SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS 前段时间学习了DeepLab&#xff0c;这里花时间记录一下&#xff0c;感谢几位小伙伴的分享。DeepLab的主体结构事实上是参照VGG改造的&#xff0c;它的几个优点&#xff1a;首先是速…

Deeplab笔记

一、Deeplab v2 对应论文是 DeepLab: Semantic Image Segmentiation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs Deeplab 是谷歌在FCN的基础上搞出来的。FCN为了得到一个更加dense的score map&#xff0c;将一张500x500的输入图像&#…

deeplab-v3+原理详解

入门小菜鸟&#xff0c;希望像做笔记记录自己学的东西&#xff0c;也希望能帮助到同样入门的人&#xff0c;更希望大佬们帮忙纠错啦~侵权立删。 目录 一、deeplab-v3提出原因与简单介绍 二、deeplab-v3网络结构图 三、Encoder 1、Backbone&#xff08;主干网络&#xff09…

深度学习 | MATLAB Deep Learning Toolbox Deeper Networks 创建

深度学习 | MATLAB Deep Learning Toolbox Deeper Networks 目录 深度学习 | MATLAB Deep Learning Toolbox Deeper NetworksDeeper Networks创建类比深度网络深度记忆原理深度学习层输入层卷积和全连接层序列层激活层归一化、丢弃和裁剪层池化和去池化层组合层输出层 参考资料…

深度学习(11)——DeepLab v1

DeepLab v1 DeepLab 由谷歌团队提出的&#xff0c;至今有了四个版本&#xff0c;也就是v1-v4。其结合了深度卷积神经网络&#xff08;DCNNs&#xff09;和概率图模型。 在论文《Semantic image segmentation with deep convolutional nets and fully connected CRFs》中提出&…

改进 DeepLabV3+

网络整体结构图 CFF结构图 import torch import torch.nn as nn import torch.nn.functional as F from nets.xception import xception from nets.mobilenetv2 import mobilenetv2class MobileNetV2(nn.Module):def __init__(self, downsample_factor8, pretrainedTrue):supe…

DeepFaceLab

DeepFaceLab从半脸&#xff08;Half Face&#xff09;到全脸&#xff08;Full Face&#xff09;再到整脸&#xff08;Whole Face&#xff09;&#xff0c;脸部替换的区域愈来愈大&#xff0c;适用的范围也越来越广&#xff0c;效果也越来越震撼。当然很多人已经不满足与单纯换脸…

DeepLab系列总结

DeepLab系列总结 DeepLab系列DeepLab V1DeepLab V2DeepLab V3DeepLab V3 DeepLab系列 DeepLab网络是由Liang-Chieh Chen&#xff08;下文以大神指代&#xff09;与google团队提出来的&#xff0c;是一个专门用来处理语义分割的模型。目前推出了4个&#xff08;或者说3.5个&…

DeepLab系列学习

DeepLab系列 文章目录 DeepLab系列DeepLabV1简介atrous algorithm利用全卷积增加感受野并加速运算条件随机场CRF实验结果多尺度预测VOC数据集上对比 DeepLabV2主要改进简介模型主体ASPP实验结果 DeepLabV3相应的改进实验 DeepLabV3(DeepLabV3 plus)相应改进整体结构解码器结构m…

deeplab系列总结(deeplab v1 v2 v3 v3+)

最近花了几天时间把deeplab系列撸了一遍&#xff0c;直观感受是不如当初看RCNN系列来的激动啊......像RPN这种划时代的改变没有看到--直奔主题。 Deeplab v1&v2 paper&#xff1a; deeplab v1 && deeplab v2 远古版本的deeplab系列&#xff0c;就像RCNN一样&…

我对DeepLab V3的理解(基于V1和V2)

一、概述 1.前言 1.1 DeepLab v1 创新点&#xff1a; 空洞卷积&#xff08;Atrous Conv&#xff09;; <解决编码过程中信号不断被下采样&#xff0c;细节丢失的问题> 全连接条件随机场&#xff08;Fully-connected Conditional Random Field&#xff09;。 <由于co…

deeplab介绍

■ 论文 | Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation ■ 链接 | https://www.paperweekly.site/papers/1676 DeepLab 是结合了深度卷积神经网络&#xff08;DCNNs&#xff09;和概率图模型&#xff08;DenseCRFs&#xff09;的方法…

DeepLab一家

DeepLab是谷歌为了语义分割又做的一系列工作&#xff0c;在多个开源数据集中都取得了不错的成果&#xff0c;DeepLabv1发表于2014年&#xff0c;后于2016、2017、2018分别提出了V2&#xff0c;V3以及V3的版本&#xff0c;在mmsegmentation里面主要集成了V3以及V3的版本&#xf…

深度学习论文精读[13]:Deeplab v3+

Deeplab v3是Deeplab系列最后一个网络结构&#xff0c;也是基于空洞卷积和多尺度系列模型的集大成者。相较于Deeplab v3&#xff0c;v3版本参考了UNet系列网络&#xff0c;对基于空洞卷积的Deeplab网络引入了编解码结构&#xff0c;一定程度上来讲&#xff0c;Deeplab v3是编解…

语义分割网络系列3——DeepLab

DeepLab 1 介绍1.1 背景1.2 Deeplab V1介绍1.3 结构1.4 特点1.4.1 空洞卷积的使用1.4.2 CRF的应用 1.5 DeepLab系列总结 2 代码3 总结参考资料 1 介绍 相比于传统的视觉算法(SIFT或HOG)&#xff0c;Deep-CNN以其end-to-end方式获得了很好的效果。这样的成功部分可以归功于Deep…

DeepLabV3网络简析

论文名称&#xff1a;Rethinking Atrous Convolution for Semantic Image Segmentation 论文下载地址&#xff1a;https://arxiv.org/abs/1706.05587 非官方Pytorch实现代码&#xff1a;pytorch_segmentation/deeplab_v3 视频讲解&#xff1a;https://www.bilibili.com/video/…

DeepLab系列(v1,v2,v3,v3+)总结

U-net: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 语义分割面临的挑战1. DeepLab v1——《Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs》&#xff08;ICLR 2015&#xff0c;谷歌&#xff09;2. Deep…