常用图像分类网络

article/2025/11/7 15:55:05

 

想对图像分类网络写个简要的概括,如有介绍不当之处,还望指出。

一、VGG网络

更新于2018年10月20日

参考博客:深度学习经典卷积神经网络之VGGNet

论文地址:VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

VGG是牛津大学计算机视觉组(VisualGeometry Group)和GoogleDeepMind公司的研究员一起研发的的深度卷积神经网络。

VGG标签:“三个臭皮匠赛过诸葛亮”

三个臭皮匠赛过诸葛亮:使用多个3*3的卷积核代替5*5的卷积核

在ILSVRC 2014比赛分类项目的第2名,分类错误率7.3%

网络结构:

其中,D列是常用的VGG16,E列是VGG19。

特点:使用3*3的小卷积核代替5*5或7*7的卷积核。原因如下:

(1)3x3是最小的能够捕获像素八邻域信息的尺寸。

(2)两个3x3的堆叠卷基层的有限感受野是5x5;三个3x3的堆叠卷基层的感受野是7x7,故可以通过小尺寸卷积层的堆叠替代大尺寸卷积层,并且感受野大小不变。

(3)多个3x3的卷基层比一个大尺寸filter卷基层有更多的非线性(更多层的非线性函数),使得判决函数更加具有判决性。

(4)多个3x3的卷积层比一个大尺寸的filter有更少的参数,假设卷基层的输入和输出的特征图大小相同为C,那么三个3x3的卷积层参数个数3x(3x3xCxC)=27C2;一个7x7的卷积层参数为49C2;所以可以把三个3x3的filter看成是一个7x7filter的分解(中间层有非线性的分解, 并且起到隐式正则化的作用。

二、Inception网络

参考博客:Google InceptionNet介绍

论文地址:Rethinking the Inception Architecture for Computer Vision

刚才讲的VGG是14年ILSVR分类比赛的老二,Inception是老大,分类错误率6.67%

Inception标签:“分而治之”,BatchNormalization

分而治之:采用分支的方式增大网络的宽度和深度能够很好的提高网络的性能,避免过拟合。

BatchNormalization:就是在每一层输出后再对输出结果进行规范化,这样使得网络更容易收敛,且分类准确率有提升。

三种Inception基本网络结构:

 

特点:InceptionNet采用分支网络堆叠在一起产生较大通道的输出。原因如下:

每个分支都采用了1*1的卷积网络,因为这是一个优秀的网络,可以跨通道组织信息,提高网络的表达能力,提供更多的非线性变换,性价比很高。同时网络中的卷积和大小也不一样,可以增加网络对不同尺度的适应性。所以,InceptionNet通过分支的方式增大网络的宽度和深度能够很好的提高网络的性能,避免过拟合。

  InceptionNet还可以将一个较大的卷积网络拆分成两个小的卷积网络。比如将7*7网络拆分成1*7和7*1的卷积网络,这样可以节约大量参数,加速运算并减轻过拟合,同时增加了一层非线性变换拓展了模型的表达能力。如上图中的后面两种Inception结构。

Inception网络结构:

figure 5/6/7分别对应着上图中的三种Inception结构

三、ResNet

参考博客:ResNet解析

论文地址:Deep Residual Learning for Image Recognition

ResNet全名Residual Net,残差网络。是ImageNet 2015年的分类冠军模型。

ResNet标签:“越级上报”

越级上报:即跨层连接,第n层的输出结果不仅输入给第n+1层,还跨两层输出给第n+3层(ResNet34),

跨三层的是ResNet50/101/152

ResNet常见的有ResNet 50、ResNet 101和ResNet 152

ResNet网络结构:

其他特点:

跨三层的ResNet先使用1*1的卷积降维,然后进行3*3的卷积之后,再用1*1的卷积升维。减少了参数数量,防止过拟合。

ResNet网络结构的特性使得即使网络层数加深,也不会导致梯度消失或者梯度爆炸的现象(链式求导)

四、DenseNet

更新于2018年10月30日

参考博客:DenseNet算法详解

论文地址:Densely Connected Convolutional Networks

DenseNet和ResNet有点像,恰巧看DenseNet的这几天听了一位长江学者的讲座,在此借用该学者的话:

“现在的人工智能(指深度学习)用的理论仍然是很多年前的人工智能的理论,像什么求梯度啊激活函数啊,没有任何理论方面的创新,有的只是框架方面的更新。”

在我看来,现在AI的发展很大方面得力于工业届的宣传,工业的热潮影响到学术界,所以现在有更多的人去研究AI。虽然现在的AI的确缺乏理论创新,但是work就行啊!管他黑猫白猫,能抓到老鼠的就是好猫!

哦该大佬说的另一句话我觉得也很有道理:

现在的学术论文,千分之一的论文是有直接价值的,剩下的千分之九九九,不能说是没有价值,它们是有潜在价值的。这些潜在价值可能在很多年后才会有人发现它们的价值所在。

好了,回归正题~

DenseNet,顾名思义,就是很紧密、稠密的网络,是CVPR2017的best paper。

DenseNet标签:太平洋警察——管的宽

太平洋警察——管的宽:某一层网络的输入不仅来自于它前面的那一层,它前面所有层的输出都要传递给该层。

DenseNet网络结构:

其他特点:

 

由于每一层的输出都传递到了后面的每一层,所以Dense connection能够有效的减轻梯度消失现象;

Dense connection还有一个好处是能够充分利用feature;

DenseNet用的卷积核数量很小,一般是32或者48;

1*1卷积(文章中叫bottleneck layer或Translation layer)的作用是降维减少参数+融合各个通道的信息。因为在对前面所有层进行concat后,拼接后的通道会很大,因此需要1*1的卷积来降维。

实验结果:

五、InceptionResNet

待续


http://chatgpt.dhexx.cn/article/OhjHvEsA.shtml

相关文章

干货——图像分类(上)

这是译自斯坦福CS231n课程笔记image classification notes,由课程教师Andrej Karpathy授权进行翻译。本篇教程由杜客翻译完成。非常感谢那些无偿奉献的大师,在此代表所有爱好学习者向您们致敬,谢谢! 这是斯坦福大学的课程&#xf…

图像分类

图像物体分类与检测算法综述 转自《计算机学报》 目录 图像物体分类与检测算法综述 目录图像物体分类与检测概述物体分类与检测的难点与挑战物体分类与检测数据库物体分类与检测发展历程 图像物体分类与检测是计算机视觉研究中的两个重要的基本问题,也是图像分割、…

【图像分类数据集】非常全面实用的垃圾分类图片数据集共享

【图像分类数据集】非常全面实用的垃圾分类图片数据集共享 数据集介绍: 训练集 文件夹结构如下(部分: 第0类文件夹下数据展示如下(部分: 测试集 大致如下: 数据集获取方式: 总结&#xf…

python学习(18)--图片分类

图片分类 学习动机. 在这一节中我们会引入图片分类为题。这也是从一个合适的集合中分配给图片一个标记的任务。这是计算机视觉的核心问题之一。鉴于它的简单性,有一大批实用应用。更多的是,我们可以在以后的章节中看到,一些看似分离的计算机…

【OpenMMLab】图片分类发展简史

一、发展简述 图片分类是CV领域的基础任务,也是检测、分割、追踪等任务的基石。简而言之,图片分类就是给定一张图片,判断其类别,一般而言所有的候选类别是预设的。 从数学上描述,图片分类就是寻找一个函数&#xff0…

深度学习(1) ——图像分类

图像分类概述 图像分类实质上就是从给定的类别集合中为图像分配对应标签的任务,当我们输入一张图片,返回一个该图像类别的标签。限制条件:只能输入单目标图像。常用数据集:mnist、CIFAR-10、CIFAR-100、ImageNet 图像分类算法 …

CNN图片分类(Pytorch)

这篇文章主要讲述用 pytorch 完成简单 CNN 图片分类任务,如果想对 CNN 的理论知识进行了解,可以看我的这篇文章,深度学习(一)——CNN卷积神经网络。 图片分类 我们以美食图片分类为例,有testing、training、validation文件夹。下…

JavaWeb学习思维导图

这是我最近总结的JavaWeb学习思维导图,希望可以帮到大家:

javaweb学习总结

重定向 请求转发 区别:重定向后浏览器地址值会发生改变。 重定向request域对象不能共享数据,因为request域的范围是一次请求一次响应。而转发能够共享数据 请求转发的路径写法,只是需要写url-pattern的地址即可,不用带项目名&am…

JavaWeb学习心得总结

JavaWeb(JSPServlet)新手学习心得总结 说明: 由于篇幅的原因,本文只是对于JavaWeb项目的大致数据流程做一个介绍,同时引出一些JavaWeb开发中很基础的知识点,且不会精确到具体代码实现。 所以本文的适合读…

JavaWeb学习笔记总结(一)

前言:因为我是大三,这学期开课是JavaWeb,前端三剑客htmlcssjs,还有一个springboot框架的课,大二下学期才学的java跟sql,所以跨度直接到springboot有点大吧,ssm框架都没学,但是b站上有挺多教程的&#xff0c…

一.JavaWeb学习路线

Java系统学习路线: 第一阶段 第一阶段: Java 基础,包括 Java 语法,面向对象特征,常见API,集合框架。(基础) 第二阶段:Java API:输入输出,多线程,网络编程,反…

java web学习_JavaWeb学习路线

Java web,是用Java技术来解决相关web互联网领域的技术综合。Web包括:web服务器和web客户端。Java在客户端的应用有Java applet,不过使用很少。Java在服务器端的应用非常的丰富,比如Servlet,JSP和第三方框架等等。java技…

JavaWeb学习笔记

JavaWeb 1.ASP、PHP、JSP ASP: 微软&#xff1a;最早流行的就行ASP 在HTML嵌入VB的脚本 在ASP中&#xff0c;基本一个界面就有几千行代码&#xff0c;页面极其混乱&#xff0c;维护成本高 c#编程语言 IIS服务器 <h1> <% system.out.println("hello") …

javaweb学习路线

一、学习顺序 1、java语法&#xff0c;语法很重要&#xff0c;没有这个根本后面的也进行不下去&#xff0c;建议先学会应用了再去研究jdk源码&#xff0c;本身就是新手就想从原理开始了解&#xff0c;估计非常吃力&#xff0c;效果也不一定好。 2、数据库&#xff0c;首先学关…

JavaWeb知识点汇总

JavaWeb知识点汇总 前言&#xff1a;跟了狂神javaweb学习有一阵子了&#xff0c;这里简单进行笔记总结&#xff0c;也是第一次使用markdown写这么长的文章&#xff0c;虽然是跟着敲的&#xff0c;也是多理解了一遍&#xff0c;以及具体上手自己写的代码和相应效果图。发布于此…

JAVAweb入门基础

1、JAVAweb开发原理 2、web服务器 2.1、技术服务 ASP&#xff08;微软 国内最早流行;在HTML中嵌入了VB的脚本&#xff0c;ASPCom;在ASp开发中&#xff0c;基本一个页面都有几千行的业务代码&#xff0c;页面及其混乱&#xff1b;维护成本高&#xff01;&#xff09; PHP(PHP…

JavaWeb学习知识总结

1.自定义 servlet 的三种方式&#xff0c;及区别? 方式一&#xff1a;编写一个类去实现Servlet接口(必须重写Servlet接口里面所有的抽象方法)方式二&#xff1a;编写一个类去继承GenericServlet抽象类(重写生命周期的service方法&#xff08;抽象法&#xff09;)GenericServle…

JavaWeb学习路线(总结自尚硅谷雷神SSM|极其详细|思路清晰|适合入门/总复习)

文章目录 JavaWeb前言说明前端技术html&#xff08;掌握&#xff09;1.标签 css&#xff08;了解&#xff09;1.简介2.常用样式定义 JavaScript&#xff08;掌握&#xff09;1.简介2.基本语法2.1声明变量2.2声明对象2.3声明方法 3.事件 JQuery&#xff08;精通&#xff09;1.简…

https证书安装部署 https证书怎么安装

http和https是我们上网的时候经常见到的网络协议&#xff0c;当我们进入一个网站的时候&#xff0c;网站的域名有时候是http开头的&#xff0c;有时候又是https开头的&#xff0c;可能你们会好奇&#xff0c;这两者究竟有什么区别呢&#xff1f;https证书又是什么呢&#xff1f…