深度学习--卷积神经网络

article/2025/8/22 12:46:32

目录

(一)输入层(Input Layer)

(二)卷积层(Convolution Layer)

(三)激活层(Activation Layer)

(四)池化层(Pooling Layer)

(五)全连接层(Full Connected Layer)

(六)输出层(Output Layer)

Definitions:

卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一  。卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariant classification),因此也被称为“平移不变人工神经网络(Shift-Invariant Artificial Neural Networks, SIANN)” 。------来自于百度百科的定义

卷积神经网络是一个层次模型。主要结构包括输入层,卷积层,池化层,激活层,全连接层以及输出层。(卷积神经网络中还有隐含层,包含卷积层、池化层和全连接层3类常见构筑,在一些更为现代的算法中可能有Inception模块、残差块(residual block)等复杂构筑。在常见构筑中,卷积层和池化层为卷积神经网络特有。卷积层中的卷积核包含权重系数,而池化层不包含权重系数,因此在文献中,池化层可能不被认为是独立的层。以LeNet-5为例,3类常见构筑在隐含层中的顺序通常为:输入-卷积层-池化层-全连接层-输出。)

(一)输入层(Input Layer)

卷积神经网络的输入层用来江原始数据或经过预处理的数据输入网络。可以处理多维数据,常见地,一维卷积神经网络的输入层接收一维或二维数组,其中一维数组通常为时间或频谱采样;二维数组可能包含多个通道;二维卷积神经网络的输入层接收二维或三维数组;三维卷积神经网络的输入层接收四维数组 。

 以图像任务为例,当输入为彩色RGB图像时,为3D张量,组成三维像素矩阵(H*W*3),若指定个数则为(N*H*W*3);当输入是灰度图像时,由于只有一个颜色通道,可以保存在2D张量中,彩色通道数只有一维,像素矩阵(H*W*1),若指定个数则为(N*H*W*1).

(二)卷积层(Convolution Layer)

卷积层通常用作对输入层输入的数据进行特征提取。卷积层越多,特征提取能力越强。卷积操做实质上是对俩个像素矩阵进行点乘求和的数学操作。其中一个矩阵为输入的数据矩阵,另一个则是卷积核(滤波器或特征矩阵),所求结果为原始图像中提取的局部特征。

 卷积核是会根据设定的步长进行移动,如stride=1则每次平移一位。计算方法就是每个网格元素与卷积核对应网格元素相乘再相加,所得的值作为新的矩阵中的元素。

卷积层中的基本参数

  • 卷积核大小(Kernel Size ):定义了卷积核的感受野。

从底层优化角度来看,3*3的卷积核最优,但近来超大卷积核7*7,21*21也带来了不错的性能。另外,俩个3*3的卷积核效果相当于一个5*5的卷积核,且计算量与参数量均有减少---轻量化)

  • 步长(stride):设置卷积核在卷积过程中移动的步长。

一般设置为1,代表每次滑动距离为1--这种方式能够覆盖所有相邻位置的特征,并将其进行组合。如果设置其他数值(>1)则相当于对特征组合进行下采样。

  • 填充(padding):当卷积核尺寸与输入图像矩阵不匹配时需要进行一定的填充策略。 

 一般padding用于边界处位置,以保证卷积输出与输入的维度一致。

  • 输入通道数(In Channels):指定卷积操作时卷积核的深度==卷积核的channel数。   

默认为与输入特征矩阵通道数(深度)一致。

  • 输出通道数(Out Channels):指定卷积核个数。                                                           

若设置与输入通道数一样,可以保证输入输出维度的一致性;若采用比输入通道更小的值,则能够减少网络整体的参数量。

  • Out channel=卷积核个数=下一层卷积的in channel (池化层不改变channel)

(三)激活层(Activation Layer)

激活层主要由激活函数构成,即在卷积层输出的线性结果上加入非线性因子,让输出的特征图具有非线性关系,能够更好的拟合那些复杂的函数。

名称图像用途缺点
Sigmoid将输入映射(0,1)区间,用来做二分类。对于一个极大的负值输入,它输出的值接近于0;对于一个极大的正值输入,它输出的值接近于1。反向传播时会存在梯度爆炸和梯度消失现象;且输出不是以0为中心,会降低学习效率。
tanhtanh可以将输入映射到(-1,1)区间,解决Sigmoid不是以0为中心输出的问题梯度消失问题和幂运算导致训练时间长
ReLUReLU将所有负值取作0,正值保持不变解决梯度消失问题且收敛速度快。但输出不是以0为中心,且可能某些神经单元永远不会被激活,导致相应参数不能被更新
Leaky ReLULeaky ReLU与ReLU很相似,仅在输入小于0的部分,值为负,且有微小的梯度解决ReLU无效神经元的部分,但效果不一定总是好于ReLU
SiLU对于较大的值,SiLU 的激活大约等于ReLU的激活。
与 ReLU最大的不同,SiLU 的激活不是单调递增的。

优点:无上界,有下界,平滑

无上界:避免过拟合

有下届:正则化效果更强

平滑:处处可导,容易训练

Mish在ImageNet上效果比ReLU和Swish都更好优点:无上界、无下界、光滑、非单调(自身就有正则化效果,使函数更加平滑,更容易泛化)。

(四)池化层(Pooling Layer)

池化层又称下采样层(Downsampling Layer),在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤,用于对感受野内的特征进行筛选,提取区域中最具有代表性的特征。                                                                                                                                           

 常见的池化操作可分为最大池化(Max Pooling),平均池化(Average Pooling)和求和池化(Sum Pooling),其分别提取感受野内最大,平均与总和的特征值作为输出。(其中yolov5中SPPF模块里使用的就是最大池化)。

(五)全连接层(Full Connected Layer)

全连接层位于特征提取之后,将前一层所有神经元与当前层的每个神经元相连接, 对提取的特征进行非线性组合以得到输出。全连接层本身不被期望具有特征提取能力,而是试图利用现有的高阶特征完成学习目标。(所以说全连接层参数量也是最多的)

在一些卷积神经网络中,全连接层的功能可由全局均值池化(global average pooling)取代  ,全局均值池化会将特征图每个通道的所有值取平均,即若有7×7×256的特征图,全局均值池化将返回一个256的向量,其中每个元素都是7×7,步长为7,无填充的均值池化。

(六)输出层(Output Layer)

卷积神经网络中输出层的上游通常是全连接层,因此其结构和工作原理与传统前馈神经网络中的输出层相同。其输出形式面向具体任务。对于图像分类问题,输出层使用逻辑函数或归一化指数函数(softmax function)输出分类标签;在物体识别(object detection)问题中,输出层可设计为输出物体的中心坐标、大小和分类;在图像语义分割中,输出层直接输出每个像素的分类结果 。


http://chatgpt.dhexx.cn/article/EiFe9cb3.shtml

相关文章

基于深度卷积神经网络,深度卷积神经网络结构

1、卷积神经网络算法是什么? 一维构筑、二维构筑、全卷积构筑。 卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深…

深度学习——卷积神经网络

卷积神经网络CNN由纽约大学的Yann Lecun于1998年提出,其本质是一个多层感知机,成功的原因在于其所采用的局部连接和权值共享的方式: 一方面减少了权值的数量使得网络易于优化另一方面降低了模型的复杂度,也就是减小了过拟合的风险…

深度卷积神经网络学习(CNN)

什么是卷积神经网络 CNN:神经网络在前面的学习中我们已经了解过很多了,其本质就是多层感知机,卷积神经网络其实也一样,但是我们可以将其看成多层感知机的变种。它成功的原因在于其所采用的局部连接和权值共享的方式: …

深度卷积神经网络及各种改进

文章目录 1、残差网络2、不同大小卷积核并行卷积3、利用(1,x),(x,1)卷积代替(x,x)卷积4、采用瓶颈(Bottleneck)结构5、深度可分离卷积6、改进版深度可分离卷积残差网络7、倒转残差(Inverted residuals)结构8、并行空洞卷积 1、残差网络 这个网络主要源自于Resnet网络&#xff…

深度学习-卷积神经网络(python3代码实现)

卷积神经网络(上) 作者:Bossof537 写这个也不容易,小哥哥小姐姐转载请注明出处吧,感谢! 1、简介 卷积神经网络与常规的神经网络十分相似,它们都由可以对权重和偏置进行学习的神经元构成。每个神…

深度神经网络与卷积神经网络的区别

前馈神经网络、BP神经网络、卷积神经网络的区别与联系 一、计算方法不同1、前馈神经网络:一种最简单的神经网络,各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。 2、BP…

深度卷积神经网络是什么,卷积神经网络结构设计

卷积神经网络算法是什么? 一维构筑、二维构筑、全卷积构筑。 卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习&a…

深度学习,卷积神经网络

卷积神经网络 1.卷积神经网络应用领域 CV领域发展 CV领域是计算机视觉(Computer Vision)领域的简称。 计算机视觉是指利用计算机模拟人类视觉系统的科学,让计算机具有类似于人类在观察外界的视觉、图像的能力,包括图像处理、图…

AlexNet-深度卷积神经网络(CNN卷积神经网络)

文章目录 深度卷积神经网络(AlexNet)AlexNet模型说明激活函数选定模型定义读取数据集训练AlexNet小结 深度卷积神经网络(AlexNet) 2012年,AlexNet横空出世。它首次证明了学习到的特征可以超越出手工设计的特征。 它一…

深度学习中的卷积神经网络

博主简介 博主是一名大二学生,主攻人工智能研究。感谢让我们在CSDN相遇,博主致力于在这里分享关于人工智能,c,Python,爬虫等方面知识的分享。 如果有需要的小伙伴可以关注博主,博主会继续更新的&#xff0c…

深度学习:卷积神经网络(详解版)

文章目录 一、全局连接VS局部连接1.1 局部神经元连接的优势1.2 全连接网络的权重参数量1.3 神经网络的局部特征提取(卷积) 二:感受野2.1 生物上的定义2.2 深度学习的定义2.3 感受野的作用2.4 感受野的计算公式2.5 感受野对网络的影响 三&…

深度卷积神经网络基本介绍

关于深度卷积神经网络的前世今生,就不在此处进行过多的介绍。在此,主要对网络的各个组成部分进行简要介绍: 图1 基本的深度卷积网络结构 通过图1可知深度卷积神经网络主要是由输入层、卷积层、激活函数、池化层、全连接层和输出层组成。以下将…

深度卷积神经网络(CNN)

CNN简述 卷积神经网络(Convolutional Neural Network,CNN),它是属于前馈神经网络的一种,其特点是每层的神经元节点只响应前一层局部区域范围内的神经元(全连接网络中每个神经元节点则是响应前一层的全部节…

深度学习|卷积神经网络

一、卷积神经网络简介 卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习神经网络结构,主要用于图像识别、计算机视觉等领域。该结构在处理图像等高维数据时表现出色,因为它具有共享权重和局部感知的特点…

什么是深度卷积神经网络,卷积神经网络怎么学

卷积神经网络通俗理解 。 卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习(deeplearning)的代表算法…

深度学习—卷积神经网络(Convolutional Neural Networks)

卷积神经网络(Convolutional Neural Networks) 卷积神经网络(convolutional neural network, CNN),是一种专门用来处理具有类似网格结构的数据的神经网络。例如时间序列数据(可以认为是在时间轴上有规律地…

深度卷积图神经网络(Deep Convolutional Graph Neural Network,DCGNN)的基本概念与应用

目录 一、引言 1.1 神经网络的发展历程 1.2 图神经网络的出现 二、深度卷积图神经网络的基本概念 2.1 图的表示 2.2 图卷积神经网络 2.3 深度卷积图神经网络 三、深度卷积图神经网络的应用 3.1 图像分类 3.2 图像分割 3.3 图像生成 四、深度卷积图神经网络的优缺点 …

超级详细的安装虚拟机教程--配图--步骤拆分

1、首先我们需要下载两个文件,一个虚拟机文件,一个程序光盘文件。然后我们安装虚拟机, 类似于这两个文件: 2、虚拟机安装好之后回来到这个页面:点击创建新的虚拟机 3、选择界面,建议选择自定义:…

VMware vSphere Client 安装虚拟机

一、VMware vSphere Client安装虚拟机步骤。 1、启动虚拟机安装,如下图所示。 2、选择所需要安装的虚拟机类型,例如Centos7 、ubuntu、debian等。 3、选择磁盘、内存、CPU大小。 4、启动虚拟机。 5、选择操作系统镜像进行安装。 二、操作系统安装。 1、…

Mac m2芯片安装虚拟机win11

写在前面,这两天安装虚拟机和Windows系统搞的我头皮发麻,遇到了很多不能解决的问题,主要就是m1/m2芯片好多软件都不兼容脑阔疼,失败的路程就不展示了,我们只展示成功过程中的修问题 一开始使用的virtual box虚拟机&am…