位置: IT常识 - 正文

BP神经网络的梯度公式推导(三层结构)(bp-神经网络)

编辑:rootadmin
BP神经网络的梯度公式推导(三层结构)

推荐整理分享BP神经网络的梯度公式推导(三层结构)(bp-神经网络),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bp神经网络的梯度是多少,bp神经网络梯度下降,bp神经网络的梯度,bp神经网络的梯度下降法,bp神经网络梯度下降,bp神经网络的梯度是多少,bp神经网络的梯度是什么,bp神经网络的梯度,内容如对您有帮助,希望把文章链接给更多的朋友!

本站原创文章,转载请说明来自《老饼讲解-BP神经网络》bp.bbbdata.com

目录

一. 推导目标

1.1 梯度公式目标 

1.2 本文梯度公式目标

二. 网络表达式梳理

2.1 梳理三层BP神经网络的网络表达式

三. 三层BP神经网络梯度推导过程

3.1 简化推导目标

3.2 输出层权重的梯度推导

3.3 输出层阈值的梯度推导

3.4隐层权重的梯度推导

 3.5 隐层阈值的梯度推导

四. 推导结果总结

4.1 三层BP神经网络梯度公式


BP神经网络的训练算法基本都涉及到梯度公式,

本文提供三层BP神经网络的梯度公式和推导过程

一. 推导目标

BP神经网络的梯度推导是个复杂活,

在推导之前 ,本节先把推导目标清晰化

1.1 梯度公式目标 

训练算法很多,但各种训练算法一般都需要用到各个待求参数(w,b)在损失函数中的梯度, 因此求出w,b在损失函数中的梯度就成为了BP神经网络必不可少的一环,

求梯度公式,即求以下误差函数E对各个w,b的偏导:

代表网络对第m个样本第k个输出的预测值,w,b就隐含在中

1.2 本文梯度公式目标

虽然梯度只是简单地求E对w,b的偏导,但E中包含网络的表达式f(x),就变得非常庞大, 求偏导就成了极度艰巨晦涩的苦力活,对多层结构通式的梯度推导稍为抽象, 本文不妨以最常用的三层结构作为具体例子入手,求出三层结构的梯度公式  即:输入层-隐层-输出层 (隐层传递函数为tansig,输出层传递函数为purelin)

虽然只是三层的BP神经网络,

但梯度公式的推导,仍然不仅是一个体力活,还是一个细致活,

且让我们细细一步一步慢慢来

二. 网络表达式梳理

在损失函数E中包括了网络表达式,在求梯度之前,

先将表达式的梳理清晰,有助于后面的推导

2.1 梳理三层BP神经网络的网络表达式

网络表达式的参考形式 隐层传递函数为tansig,输出层传递函数为purelin的三层BP神经网络, 有形如下式的数学表达式  

网络表达式的通用矩阵形式  写成通用的矩阵形式为

这里的为矩阵,和为向量, 上标(o)和(h)分别代表输出层(out)和隐层(hide),

例如,2输入,4隐节点,2输出的BP神经网络可以图解如下:

 

三. 三层BP神经网络梯度推导过程

本节我们具体推导误差函数对每一个待求参数w,b的梯度

3.1 简化推导目标

由于E的表达式较为复杂,  不妨先将问题转化为"求单样本梯度"来简化推导表达式  对于任何一个需要求偏导的待求参数w,都有:

BP神经网络的梯度公式推导(三层结构)(bp-神经网络)

即损失函数的梯度,等于单个样本的损失函数的梯度之和(E对b的梯度也如此), 因此,我们先推导单个样本的梯度,最后再对单样本梯度求和即可。 现在问题简化为求

3.2 输出层权重的梯度推导

输出层权重梯度推导 输出层的权重为"输出个数*隐节点个数"的矩阵, 现推导任意一个权重wji (即连接第i个隐层与第j个输出的权重)的单样本梯度 如下: 事实上,只有第j个输出是关于 的函数,也即对于其它输出  因此,  上式即等于

继续求导是第j个输出的误差,简记为                      是第j个隐节点的激活值,简记为(A即Active)

上式即可写为             

上述是单样本的梯度, 整体样本的梯度则应记为 

 M,K为样本个数、输出个数                                         是第m个样本第j个输出的误差      是第m个样本第i个隐节点的激活值    

3.3 输出层阈值的梯度推导

输出层阈值梯度推导 对于阈值(第j个输出节点的阈值)的推导与权重梯度的推导是类似的, 只是上述标蓝部分应改为

简记为

上述是单样本的梯度, 整体样本的梯度则应记为   M,K为样本个数、输出个数                ​是第m个样本第j个输出的误差      

3.4隐层权重的梯度推导

隐层的权重为"隐节点个数*输入个数"的矩阵, 现推导任意一个权重(即连接第i个输入与第j个隐节点的权重)的单样本梯度 如下:

只有第j个tansig是关于 的函数,所以上式可以写成

 

继续求导    

又由 所以上式为: 简写为

上述是单样本的梯度,对整体样本则有:  M,KM,K为样本个数、输出个数                                              ​是第m个样本第k个输出的误差        是第m个样本第i个隐节点的激活值           ​是第m个样本第i个输入                                                  

 3.5 隐层阈值的梯度推导

隐层阈值梯度推导 对于阈值b_\textbf{j}^{(h)}  ​(第j个隐节点的阈值)的推导与隐层权重梯度的推导是类似的, 只是蓝色部分应改为

又由 所以上式为: 简写为

上述是单样本的梯度,对整体样本则有:  M,K为样本个数、输出个数                                              是第m个样本第k个输出的误差        是第m个样本第i个隐节点的激活值         

四. 推导结果总结4.1 三层BP神经网络梯度公式

输出层梯度公式 输出层权重梯度:                         输出层阈值梯度:                                             

隐层梯度公式 隐层权重梯度:  隐层阈值梯度:       

✍️符号说明  M,K为样本个数、输出个数                                               是第m个样本第k个输出的误差        ​是第m个样本第i个隐节点的激活值           是第m个样本第i个输入                                                  

 相关文章

​《BP神经网络梯度推导》

​​​​​​《BP神经网络提取的数学表达式》

《一个BP的完整建模流程》

本文链接地址:https://www.jiuchutong.com/zhishi/299419.html 转载请保留说明!

上一篇:【Java编程指南】方法(java编程入门基础教程)

下一篇:朴素贝叶斯(Naive Bayes)详解(朴素贝叶斯算法)

  • 怎么算印花税计算器
  • 工会经费应该怎么做账
  • 投资入股变更股权比例
  • 联合体项目工程款如何拨付
  • 工程预缴税款流程
  • 职工的补助金需交税吗
  • 增值税进项税转出文件
  • 哪些单位和个人可构成全宗
  • 会计分录怎么确认借贷方向
  • 存货的计价方法有哪些,具体内容是什么
  • 关联企业间无偿资金的占用属于借款费用吗
  • 服务业工资计入成本还是营业费用
  • 零税率发票可以冲成本吗
  • 停车场企业所得税税率
  • 虚开发票可以做进项税额转出分录吗?
  • 稳岗补贴会计怎么做账
  • 财务保证金怎么做分录
  • 建筑劳务公司人员结构
  • 非同一控制下企业合并的交易费用
  • 当月支付费用当月收到发票
  • 单位内部控制
  • 事业单位工会经费会计账务处理办法
  • 企业合并案例
  • 抵押和质押的区别主要表现在哪些方面
  • 如何激活windows10免费
  • php面向对象优点,缺点
  • 工业企业汽车发生费用处理
  • 最有艺术气质的动物
  • 增值税检查的内容
  • 深度学习实战10-数学公式识别-将图片转换为Latex(img2Latex)
  • 增值税纳税申报表在哪里打印
  • 苏尼亚尼
  • 免交的增值税要交所得税吗
  • 帝国cms怎么上传图片
  • 汽车抵押贷款会上征信吗
  • 资产负债表各项目的填列依据是
  • php5.6漏洞
  • mysql in()
  • 门诊收费票据能重新打印吗
  • 个税专项附加扣除标准调整
  • 一般纳税人也会被税吗
  • 小规模卖固定资产怎么开票
  • 企业年有什么用
  • 帐务处理程序
  • 异地办理税务登记需要什么资料
  • 办理食品经营许可证需要什么条件
  • 外资企业再投资退税
  • 备查账簿有没有固定的格式
  • 深入浅出意思
  • Win2008 R2 mysql 5.5 zip格式mysql 安装与配置
  • win8windows设置在哪里
  • win8更改桌面位置
  • 怎么用winxp的系统光盘启动
  • xp系统怎么删除系统
  • window10 uwp
  • centos 6.5安装教程
  • mac使用命令
  • linux的run目录放什么文件
  • centos安装总结
  • 短链接生成app
  • win10ipv4 ipv6无internet访问权限
  • 回调阶段
  • Unity AssetBundle爬坑手记
  • grid表格
  • cocos 2d x
  • glortho函数
  • bat中if语句的用法
  • Android Toast设置弹窗大小
  • jq点击图片让图片进行切换
  • Android studio 无法勾选sdk
  • shell脚本中获取日期
  • javascript怎么做
  • js垂直对齐
  • python中tab
  • 全面解析朝鲜战争
  • js实现类
  • 安卓快速开发平台
  • 税务局赵昭
  • 北京朝阳税务局办税大厅
  • 哪些税和费计入应交税费
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设