三层神经网络的BP(BackPropagation)算法推导

article/2025/8/23 23:27:03

BP算法:

利用的是sigmoid函数来搭建的一个三层神经网络。假设其拓扑结构如图1-1所示。

图1-1   三层神经网络

 

该网络的运行流程为:当输入一个样例后,获得该样例的特征向量,再根据权向量得到感知机的输入值,然后使用sigmoid函数计算出每个感知机的输出,再将输出作为下一层感知机的输入,以此类推,知道输出层。

反向传播算法就是用来对每个感知机的权向量逐步进行优化。为了得到最优化权向量,这边我们使用L2作为损失函数来不断调整权向量。下面就是每一个训练样例的损失函数(式1-1):

                                                                E(\overrightarrow{\omega })=\frac{1}{2}_{k\epsilon outputs}\sum(t_{k}-o_{k})^{2}                                                       (式1-1)

在多层神经网络中,误差曲面可能有多个局部极小值,所以我们用梯度下降找到的是局部极小值,而不是全局最小值。

具有一层隐藏层的反向传播:

1.将网络中的所有权值随机初始化。

2.对每一个训练样例,执行如下操作:

A.根据实例的输入,从前往后依次计算,得到输出层的每个单元的输出。然后从输出层开始反向计算每一层的每个单元的误差。

B.对于输出层的每个单元的k,计算它的误差:

                                                              \delta _{k} = O_{k}(1-O_{k})(t_{k}-O_{k}])                                                                     (式1-2)

C.对于网络中每个隐藏层单元h,计算他的误差项:

                                                             \delta _{h} = O_{h}(1-O_{h})\sum_{k\in outputs}w_{kh}\delta_{h}                                                               (式1-3)

D.更新每个权值:

                                                             w_{ji} = w_{ji} + \eta \delta_{j}x_{ji}                                                                                   (式1-4)

                                                             \bigtriangleup w_{ji} = \eta\delta_{j}x_{ji}被称为权值更新法则                                                           (式1-5)

符号说明:

x_{ji}:节点i到节点j的输入,w_{ji}:表示节点i到节点j对应的权值

outputs:表示整个输出层结点集合

BP算法推导过程:

算法的推导主要是利用梯度下降算法求解最小化损失函数的过程,现在损失函数为:

                                                    E(\overrightarrow{\omega })=\frac{1}{2}_{k\epsilon outputs}\sum(t_{k}-o_{k})^{2}   

对于网络中每个权值w_{ji},计算其导数:

                                                        \frac{\partial E}{\partial w_{ji}} = \frac{\partial E}{\partial net_{j}} \frac{\partial net_{j}}{\partial w_{ji}}

                                                                  = \frac{\partial E}{\partial net_{j}} \frac{\partial}{\partial w_{ji}}(\sum_{i=0}^{n}w_{ji}x_{ji})

                                                                  = \frac{\partial E}{\partial net_{j}} x_{ji}

1.若j是网络层的输出单元

net_{j}的求导:

                                                                        \frac{\partial E}{\partial net_{j}} = \frac{\partial E}{\partial O_{j}} \frac{\partial O_{j}}{\partial net_{j}}

其中:

                                                        \frac{\partial E}{\partial O_{j}}= \frac{\partial}{\partial O_{j}} \sum_{k\in outputs }(t_{k} - O_{k}) ^{2}

                                                                 \overset{k=j}{=}\frac{1}{2}2(t_{j} - O_{j})\frac{\partial (t_{j} - O_{j})) }{\partial O_{j}}

                                                                  = -(t_{j} - O_{j})

 

                                                         \frac{\partial O_{j}}{\partial net_{j}} = \frac{\partial \sigma(net_{j})}{\partial net_{j}} = O_{j}(1 - O_{j})

所以有:

                                                          \frac{\partial E}{\partial net_{j}} = \frac{\partial E}{\partial O_{j}} \frac{\partial O_{j}}{\partial net_{j}}

                                                                      = -(t_{j} - O_{j})O_{j}(1-O_{j})

为了使表达简洁,我们使用:

                                                   \delta _{i} = - \frac{\partial E}{\partial net_{j}} = (t_{j} - O_{j})O_{j}(1-O_{j})

权值的改变朝着损失函数的负梯度方向,于是有权值改变量:

                                                               \bigtriangleup w_{ji} = -\eta \frac{\partial E }{\partial w_{ji}}    

                                                 = -\eta[-(t_{j} - O_{j})O_{j}(1-O_{j})]x_{ji} = \eta(t_{j} - O_{j})O_{j}(1-O_{j})x_{ji}=\eta\delta _{j}x_{ji}

2.若j是网络层的隐藏单元

由于隐藏单元中w的值通过下一层来间接影响输入,故使用剥离的方式来进行求导:

                    \frac{\partial E}{\partial net_{j}}= \sum_{k \in outputs} \frac{\partial E}{\partial net_{k}} \frac{\partial net_{k}}{\partial net_{j}}= \sum_{k \in outputs} -\delta_{k} \frac{\partial net_{k}}{\partial net_{j}}= \sum_{k \in outputs} -\delta_{k} \frac{\partial net_{k}}{\partial \sigma _{j}} \frac{\partial \sigma_{j}}{\partial net_{j}}

因为:

                                                  \frac{\partial net_{k}}{\partial \sigma_{j}}= \frac{\partial }{\partial net_{j}}\sum _{s \in hidenlayer}w_{ks}\sigma_{ks} = w_{kj}

                                                                     \frac{\partial \sigma_{j}}{\partial net_{j}} = O_{j}(1-O_{j})

所以:

                                  \sum_{k \in outputs} -\delta_{k} \frac{\partial net_{k}}{\partial \sigma _{j}} \frac{\partial \sigma_{j}}{\partial net_{j}}= \sum_{k \in outputs}-\delta_{k}w_{kj}O_{j}(1-O_{j})

同样,我们使用:

                                           \delta_{i} = -\frac{\partial E}{\partial net_{j}} = o_{j}(1-O_{j})\sum_{k \in outputs}\delta_{k}w_{kj} 

所以权值变化量:

                                        \bigtriangleup w_{ji} = -\eta\frac{\partial E}{\partial w_{ji}}= -\eta\frac{\partial E}{\partial net_{ji}}x_{ji} = \eta\delta_{j}x_{ji}

 

 

 

参考博客:https://www.cnblogs.com/liuwu265/p/4696388.html


http://chatgpt.dhexx.cn/article/dITFfpnF.shtml

相关文章

多层神经网络BP算法解释

# 多层神经网络BP算法解释 ## 前向传播 *** * 该项目采用反向传播算法描述了多层神经网络的教学过程。 为了说明这个过程,使用了具有两个输入和一个输出的三层神经网络,如下图所示: 每个神经元由两个单元组成。 第一单元添加权重系数和输入信号的乘积。 …

python实现神经网络_Python实现的三层BP神经网络算法示例

本文实例讲述了Python实现的三层BP神经网络算法。分享给大家供大家参考,具体如下: 这是一个非常漂亮的三层反向传播神经网络的python实现,下一步我准备试着将其修改为多层BP神经网络。 下面是运行演示函数的截图,你会发现预测的…

BP神经网络(3层)

终于放假啦,于是就想着把前一段时间学习的知识给整理一下,希望能够对小伙伴们有所帮助。 数学原理 BP(Back Propagation)(Rummelhart D, McClelland J.,1986)神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络。 三层BP神经网络的组成主要…

基于三层BP神经网络的人脸识别

实验四、基于三层BP神经网络的人脸识别 一、 实验要求 采用三层前馈BP神经网络实现标准人脸YALE数据库的识别,编程语言为C系列语言。 二、BP神经网络的结构和学习算法 实验中建议采用如下最简单的三层BP神经网络,输入层为 ,有n个神经元节点&a…

神经网络笔记1-三层BP神经网络

神经网络笔记1-三层BP神经网络 神经网络性质简介信息正向传输预期神经网络的获得误差反向更新(输出层→隐藏层)误差反向更新(隐藏层→输入层) 伪代码实现训练函数测试函数,用训练好的神经网络预测 手写数字识别举例识别…

BP神经网络的梯度公式推导(三层结构)

本站原创文章,转载请说明来自《老饼讲解-BP神经网络》bp.bbbdata.com 目录 一. 推导目标 1.1 梯度公式目标 1.2 本文梯度公式目标 二. 网络表达式梳理 2.1 梳理三层BP神经网络的网络表达式 三. 三层BP神经网络梯度推导过程 3.1 简化推导目标 3.2 输出层权重…

三层架构的搭建

目录 实验拓扑: 实验要求: 使用的技术有: ospf技术、NAT技术、静态、DHCP、VRRP 、STP、 VLAN、TRUNK 、 access接口模式、 以太网中继Eth-Trunk(华为) 技术、vlan管理技术 实验思路: 实验过程: IP地址的配置&am…

tfs路径映射已存在

环境:VS2019、Win10 最近公司服务器更换,想要将tfs项目映射到原来的工作区,提示“tfs-路径 XXX 已在工作区 XXX;XXX 中映射”,通过网络查找资料得知,需要修改Team Foundation的配置文件: 1.找到目录&#x…

TFS2012 权限设置

环境: TFS2012 win7 1.安装好TFS 2.创建系统用户组: TFSAdmins、TFSDevs、TFSUsers 分别为TFS管理人员组、TFS开发人员组、TFS普通用户组。 如下图: 这样我们在TFS的权限设置里,都只针对这三个组设权限,不会具体到…

TFS学习

一、TFS是什么 TFS全称是 Team Foundation Server,是 Microsoft 提供的 源代码管理、数据收集、报告和项目跟踪的平台工具。 主要功能 版本管理:工作区(workspace)、变更集(changeset)、标签并行开发支持…

tfs java_TFS (Team Foundation Server) 2013集成Maven构建

Team Foundation Server原生就支持跨平台的构建,包括Ant和Maven两种构建方式。通过配置构建服务器,连接TFS源代码库,可以实现持续集成构建,自动检测代码库健康状况,进而实现自动测试和部署。本文以Maven为例&#xff0…

Azure DevOps Server 2019 (TFS)安装教程

(1)安装教程: Azure DevOps Server 2019 (TFS)安装教程 - danzhang - 博客园 Azure DevOps Server 的安装教程_躺平佛系周大侠的博客-CSDN博客 1.配置数据库,使用默认的sql express 2.搜索配置, 使用默认…

TFS用户组说明和用户权限配置过程

一、TFS默认用户组的说明 服务器级别用户组: 1、TFS服务器/Team Foundation Valid Users:可以访问TFS服务器。 2、TFS服务器/Team Foundation Licensed Users:可以连接TFS服务器。这个组只在 Team Foundation Server Workgroup Edition 版本…

linux系统tfs安装,Jenkins使用TFS部署

之前发表过一篇Jenkins的文章《使用Jenkins部署.Net应用程序》,里面是使用GIT做的版本管理,今天更新下使用TFS做版本管理。 首先在插件管理中搜索tfs,我这里因为已经装了,所以在已安装列表里,没装的话在可选插件列表中…

TFS淘宝分布式文件核心存储引擎源码架构剖析实现

这里写目录标题 相关背景介绍相关设计思路介绍项目基础文件系统接口扇区文件结构关于inode为什么淘宝不用小文件存储淘宝网为什么不用普通文件存储海量小数据? 设计思路关键数据结构哈希表 代码日志mmp_file.hmmap_file.cppfile_op.hmain_mmap_op_file.cppindex_han…

webstorm TFS 插件的安装与使用

翻看网上帖子,有直接在webstrom的Plugins下载TFS插件的,很遗憾,同样的操作我始终搜索不到,跟同事要了现成的安装包 点击这里下载 1、解压后,放到websotrom的plugins文件夹里 2、重启ws,点击 File》Setting…

TFS映射关系出错的几种

服务器更换 开发小组更换了一台新的 TFS 服务器,旧的 TFS 服务器停止使用。但从客户端 VS2005 连接到新的服务器,并下载源码到本地原来工作的文件夹时,出现错误提示,说本地文件夹已被映射到了旧的服务器上,不能从新服…

IDEA安装TFS插件

现在在Plugins已经搜不到TFS插件了,只能在官网TFS - IntelliJ IDEs Plugin | Marketplace 下载对应的版本zip包,采用Install Plugins From Diak方式安装, 如果出现如下问题,那就换个版本试试看。 换个版本之后: 重启之…

TFS 操作指令

最近厂商来公司做项目,人员来来往往的很多,有人签出后没有签入就走了,只好想办法强制解除。从网上找到了解决办法,但照着做出了好多错,特此记录。 1.强制解除被独占签出的文件必须使用命令工具tf.exe 该文件在C:\Pro…

tfs java_Java SDK for TFS

Java SDK for TFS 05/19/2011 2 分钟可看完 本文内容 So you don’t use Visual Studio as your main IDE and instead use Eclipse with Team Explorer Everywhere but want to tailor TFS to suite your (and/or your teams) needs. Not a problem as with this new SDK it’…