深度神经网络算法分析

article/2025/10/6 5:32:59

深度神经网络算法分析

人工智能的分类

  1. 弱人工智能:特定任务与人类智力或者效率持平
  2. 通用人工智能:具有人类智力水平,解决通用问题
  3. 超人工智能:超过人类智力水平,可以在创造力上超过常人

机器学习的类型

  1. 监督学习:通过标签的训练数据集(人脸识别)
  2. 无监督学习:通过无标签数据集自动发掘模式(文本自聚类)
  3. 增强学习:通过反馈或者奖惩机制学习(游戏)

人工智能,机器学习,深度学习的关系

  1. 人工智能:它是研究,开发用于模拟,延伸和扩展人的智能的理论,方法,技术和应用系统的一门技术科学
  2. 机器学习:如果一个程序可以在任务T上,随着经验E的增加,效果P也可以随之增加,则称这个程序可以在经验中学习
  3. 深度学习:基于深度人工神经网络,自动地将简单的特征组合成更加复杂的特征,并使用这些组合特征解决问题。

人工智能是个大范围,包括了机器学习,机器学习包括了深度学习

深度学习的应用

  1. 语音识别
  2. 计算机视觉
  3. 自然语言处理

深度学习与传统机器学习的差别

在这里插入图片描述

深度学习的三个基础算法

  1. DNN(deep neural networks)
  2. CNN (convolutional neural networks)
  3. RNN (recurrent neuron network)

深度学习与人工神经网络

一句话来说就是深度学习的基础就是人工神经网络,而人工神经网络是由生物神经网络的启发得来的。
在这里插入图片描述

人工神经网路的最小单元称为感知机,但是现在常常称为神经元。

神经元的内部在这里插入图片描述

神经元是是人工神经网络的最小单元
在上图中

  • 输入:一个向量
  • 输出:一个标量
  • 在中间部分,一个大圆,一个正方形,代表运算
    • 线性变换(加权求和)
    • 非线性变化(非线性函数)

输出就是由线性变换和非线性变换得到的
其实每个神经元可以看作一个复合函数,整个神经网络就是一个大的复合函数

于是,神经元内部的运算,就可以分开看成下面两个函数,其中w,b分别为权重和偏秩,一开始可以人为取值,随着机器的不断学习,w和b会不断的更新。

z = ∑ i = 1 k f ( x i ) = x 1 w 1 + x 2 w 2 + x 3 w 3 + . . . . . + x k w k + b a = g ( z ) z=\sum_{i=1}^{k}f(x_i)=x_1w_1+x_2w_2+x_3w_3+.....+x_kw_k+b\\ a=g(z) z=i=1kf(xi)=x1w1+x2w2+x3w3+.....+xkwk+ba=g(z)

可以看出, a = f ∘ g ( x 1 , x 2 , x 3 . . . . . , x k ) a=f\circ g(x_1,x_2,x_3.....,x_k) a=fg(x1,x2,x3.....,xk)的复合函数形式。

also:

通过人为设置得到的参数称为超参数。

系统输入与输出

深度学习模型本质上也是一个运算过程
在这里插入图片描述

以房价预测为例:
样本(特征值):面积,楼层,户型。。。。
标签:价格
那么通过采集得到的数据集应该是下面这样:
在这里插入图片描述

多层感知机

神经网络又被称为多层感知机模型在这里插入图片描述

上图中一共有四层神经模型,不算入input层,只有参与运算过程的层数才能算进去,包括output层

FC(全连接):每个神经元都和下一层的所有神经元相连

训练过程三部曲

1. 正向传播(从input到output,计算预测值)

  • 参数( w , b w,b w,b)
  • 常见的激活函数

2. 反向传播(从output到input)

  • 常见的损失函数
  • BP算法

3. 梯度下降

  • 参数的更新过程
    通过预测值和真实值之间的损失函数不断的求偏导数,更新w,b的值。
    w = w − ∂ d w w=w-\partial dw w=wdw
    b = b − ∂ d b b=b-\partial db b=bdb
    在这里插入图片描述
  • 学习率
  • 梯度下降的三种方式

激活函数

在上面提到的 a = g ( z ) a=g(z) a=g(z),其中g就是激活函数,存在于非线性变换里面。通过引入激活函数,使得模型具有非线性的划分能力。将每个线性组合送入激活函数,将输出结果送入下一层神经元的输入。

常见的激活函数:

sigmoid函数:(logistic函数)

早期流行的激活函数,RNN-LSTM网络还会用到。

f ( z ) = 1 1 + e − z f(z)=\displaystyle\frac1{1+e^{-z}} f(z)=1+ez1

特点是:

  1. 将一个是实数映射到(0,1)之间
  2. 在特征相差不大的时候效果比较好

用法:
通常用来做二分类

缺点:

  1. 激活函数计算量大
  2. 容易出现梯度消失:当数据分布在曲线平滑位置的时候很容易出现梯度消失,梯度容易饱和。

图像(python 绘制):
在这里插入图片描述

Tanh 函数(双切正切函数)

f ( x ) = e x − e − x e x + e − x \displaystyle f(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}} f(x)=ex+exexex
特点:

  1. 取值范围为[-1,1]
  2. 输出以0为中心
  3. 可以看成是一个放大版本的sigmoid函数

用法:

  1. tanh函数比sigmoid函数更加的常用
  2. 循环神经网络会用
  3. 二分类问题
  4. 靠近输出值位置

缺点:

  1. 梯度容易消失
  2. 在曲线水平的区域学习非常的慢

图像:

在这里插入图片描述

Relu 函数(激活函数的重要发明)

f ( x ) = m a x ( 0 , x ) f(x)=max(0,x) f(x)=max(0,x)

特点:

  1. relu函数对与梯度收敛有巨大加速作用
  2. 只需要一个阀值就可以得到激活值节省计算量

用法:
深层网络中隐藏层常用

缺点:
过于生猛,一言不合就会使得数据变为0,从此结点后的相关信息全部丢失。

图像:

在这里插入图片描述

其实还有一种函数leaky-ReLU 函数,就是在其负区间弄一定斜率的函数,解决RELU函数的0区间带来的影响,一般为 m a x ( k x , 0 ) max(kx,0) max(kx,0),k就是leak常数,一般为0.01或0.02,或通过学习得到。

also:
图像绘制可以看sigmoid Relu and tanh函数图像绘制

特殊的激活函数
  1. SoftMax函数
  2. 线性激活函数
    y = x y=x y=x,仅仅用于线性回归

http://chatgpt.dhexx.cn/article/wOJ7Cuvi.shtml

相关文章

神经元网络算法的思想,神经元算法大全图解

什么是人工神经元算法 人工神经网络算法 “人工神经网络”(ARTIFICIAL NEURAL NETWORK,简称ANN)是在对人脑组织结构和运行机制的认识理解基础之上模拟其结构和智能行为的一种工程系统。 早在本世纪40年代初期,心理学家McCulloch、数学家Pitts就提出了人…

秒懂算法 | 基于图神经网络的推荐算法

图神经网络(Graph Neural Networks,GNN)是近几年兴起的学科,用来作推荐算法自然效果也相当好,但是要学会基于图神经网络的推荐算法之前,需要对图神经网络自身有个了解。 图卷积网络(Graph Convolutional Networks,GCN)提出于2017年。GCN 的出现标志着图神经网络的出现。深度学习…

浅谈神经网络算法

我们在设计机器学习系统时,特别希望能够建立类似人脑的一种机制。神经网络就是其中一种。但是考虑到实际情况,一般的神经网络(BP网络)不需要设计的那么复杂,不需要包含反馈和递归。人工智能的一大重要应用,…

【深度学习】3-4 神经网络的学习- 学习算法的实现

神经网络的学习步骤如下所示: 步骤1(mini-batch) 从训练数据中随机选出一部分数据,目标是减小mini-batch的损失函数的值 步骤2(计算梯度) 为了减小mini-batch的损失函数的值,需要求出各个权重参数的梯度 步骤3(更新参数) 将权重参数沿梯度…

神经网络算法基本介绍,简单神经网络算法原理

神经网络是什么? 生物神经网络主要是指人脑的神经网络,它是人工神经网络的技术原型。 人脑是人类思维的物质基础,思维的功能定位在大脑皮层,后者含有大约10^11个神经元,每个神经元又通过神经突触与大约103个其它神经…

神经元的计算

神经元的计算 单神经元内部参数的设置偏移值 b 的作用神经网络的分层常用的激活函数 单神经元 人类大脑神经元细胞的树突接收来自外部的多个强度不同的刺激,并在神经元细胞体内进行处理,将其转化为一个输出结果,功能抽象图示: 神…

神经学习(算法)

神经元与激励函数 神经元 神经元是神经网络的基本组成,如果把它画出来,大概就长成下面这样: 图中神经元左边的x表示对神经元的多个输入,w表示每个输入对应的权重,神经元右边的箭头表示它仅有一个输出。 当然神经元也…

神经网络十大算法有哪些,神经网络十大算法排名

数学建模的十大算法 。 1、蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法)2、数据拟合、参数估计、插值等数据处理算法…

训练神经网络的五大算法

原文: 5 algorithms to train a neural network 作者: Alberto Quesada 译者: KK4SBB 责编:何永灿,关注人工智能,投稿请联系 heyccsdn.net 或微信号 289416419 神经网络模型的每一类学习过程通常被归纳为一…

论文阅读2--《融合多因素的短时交通流预测研究》

1.问题的提出 现有的交通流预测研究大多为常态下的预测,而未考虑天气、节假日等外部因素的影响。 2.交通流预测相关工作 (1)传统的短时交通流研究方法: 卡尔曼滤波模型、历史平均模型、时间序列模型、非参数回归模型、混沌理论…

用于交通流预测的时间多图卷积网络

为了联合建模道路网络中各种全局特征的空间、时间和语义关联,本文提出了一种用于交通流预测的深度学习框架T-MGCN(时态多图卷积网络)。首先,我们识别了几种语义关联,并将道路之间的非欧几里德空间关联和异构语义关联编…

交通流分析1:《基于大数据的城市公路交通流短时预测研究_张红》阅读总结

大概读了一下,第6节小波分析那里实在没有看懂。 如果有理解不对的地方欢迎批评指正。 建模方法 这篇论文选用的是时间序列模型和小波理论,小波理论那里我实在没看懂,说说他基于时间序列模型的组合建模方法,这是选择时间序列模型的…

matlab中的AR模型短时预测交通流

1、内容简介 略 438-可以交流、咨询、答疑 2、内容说明 智能交通系统的宗旨,就是利用丰富的交通检测数据,对未来的交通流状态进行预测,对于最大效率的利用快速路资源,减少出行者时间,减少快速路交通拥挤与交通事故。短时交通流预测是道路交通控制系统、交通流诱导系统等领域…

交通流预测爬坑记(三):使用pytorch实现LSTM预测交通流

很长时间没有更新内容了,上一篇可以看做是刚接触深度学习写的,看法非常狭隘,内容非常粗糙。 在最近的学习中接触到了Pytorch,不得不承认,相对于TensorFlow来讲,灵活很多。 这次就使用pytroch来进行一下交通…

Python交通流仿真【含源码】

虽然交通并不总是畅通无阻,但汽车无缝穿越交叉路口,在交通信号灯处转弯和停车看起来相当壮观。这种沉思让我思考交通流对人类文明的重要性。 在此之后,内心的书呆子特质让我忍不住思考一种模拟交通流的方法。我在一个涉及交通流量的本科项目…

基于深度学习的短时交通流预测与优化

TOC 第二章 数据预处理与短时交通流量特性分析 2.1 数据来源 数据记录了明尼苏达州双子城19条高速环城公路一整年的交通流量,交通流量数据采样间隔为30秒(采用2018年6月1日至8月31日期间,采集间隔为5分钟,选取公路上的5个车辆检测站点的交…

基于Spatial-Temporal Transformer的城市交通流预测

文章信息 本周阅读的论文是题目为《Spatial-Temporal Transformer Networks for Traffic Flow Forecasting》的一篇2021年发布在arXiv网站上的使用时空Transformer网络(STTNs)预测交通流的文章。 摘要 交通预测已成为智能交通系统的核心组成部分。然而&a…

基于推特数据挖掘交通事件的城市交通流深度学习预测模型

文章信息 本周阅读的论文是题目为《A deep-learning model for urban traffic flow prediction with traffic events mined from twitter》的一篇2021年发表在《World Wide Web》涉及交通事故下的城市交通客流预测的文章。 摘要 短期交通预测是现代城市交通管理和控制系统的关键…

交通流优化:一种强化学习方法

1. 文章信息 《Traffic flow optimization: A reinforcement learning approach》是2016年发表在Engineering Applications of Artificial Intelligence的一篇文章。 2. 摘要 交通拥堵会导致诸如延误、燃油消耗增加和额外污染等重要问题。本文提出了一种新的基于强化学习的交通…

SUMO交通流仿真实战

理解、预测并最终减少城市路网中的交通拥堵是一个复杂的问题。即使了解最简单的单车道情况下出现的交通拥堵, 也是具有挑战性的。SUMO是一个开源平台,可模拟复杂环境中的交通流。在这个教程里,我们将学习如何从零创建复杂的交通流模拟&#x…