位置: IT常识 - 正文

神经网络的学习率如何选择?(神经网络浅讲)

编辑:rootadmin
神经网络的学习率如何选择? 文章目录学习率的概念学习率的选择方法参考资料学习率的概念

推荐整理分享神经网络的学习率如何选择?(神经网络浅讲),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:人工智能神经网络算法,神经网络知识,神经网络讲解与实例,神经网络 入门,神经网络浅讲,神经网络 入门,神经网络 入门,人工神经网络,内容如对您有帮助,希望把文章链接给更多的朋友!

这里的学习率指的是深度学习神经网络训练过程中选取的一个超参数。 学习率作为参数更新时的一个乘数项,可以影响网络训练的速度,或者说是每次迈步的大小。 可以这样理解,如果学习率过大,那么步子就会很大,容易越过了正确答案,从一个错误到另一个错误;如果学习率过小,那么步子就很小,训练很慢,而且不容易跳出局部最优解。如下图所示。 可以看出小学习率会进入局部最优解中,但是它也跳不出去。大的学习率无法进入局部最优,甚至随着训练越来越坏。

学习率的选择方法

学习率的选择更多的依靠经验。那么除了经验之外呢?

https://arxiv.org/abs/1506.01186 上面的论文提出了一种方法来寻找初始学习率。

神经网络的学习率如何选择?(神经网络浅讲)

首先我们设置一个非常小的初始学习率,比如1e-5(还可以更小),然后在每个batch之后都更新网络,同时增加学习率,统计每个batch计算出的loss。最后我们可以描绘出学习的变化曲线和loss的变化曲线,从中就能够发现最好的学习率。

从上面的图片可以看到,随着学习率由小不断变大的过程,网络的loss也会从一个相对大的位置变到一个较小的位置,同时又会增大,这也就对应于我们说的学习率太小,loss下降太慢,学习率太大,loss有可能反而增大的情况。从上面的图中我们就能够找到一个相对合理的初始学习率,0.1。

之所以上面的方法可以work,因为小的学习率对参数更新的影响相对于大的学习率来讲是非常小的,比如第一次迭代的时候学习率是1e-5,参数进行了更新,然后进入第二次迭代,学习率变成了5e-5,参数又进行了更新,那么这一次参数的更新可以看作是在最原始的参数上进行的,而之后的学习率更大,参数的更新幅度相对于前面来讲会更大,所以都可以看作是在原始的参数上进行更新的。正是因为这个原因,学习率设置要从小变到大,而如果学习率设置反过来,从大变到小,那么loss曲线就完全没有意义了。

另外还有两种方法见参考资料一。

参考资料

https://baijiahao.baidu.com/s?id=1662117095018026462&wfr=spider&for=pc https://blog.csdn.net/m0_37789876/article/details/85248565 https://blog.csdn.net/u010087338/article/details/122949354 https://zhuanlan.zhihu.com/p/31424275

本文链接地址:https://www.jiuchutong.com/zhishi/300821.html 转载请保留说明!

上一篇:WebSocket(websocket怎么读)

下一篇:机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

  • 上月多计提增值税
  • 应交增值税已交税金是什么意思
  • 小微企业税收优惠政策2023年房产税
  • 暂估的应付账款无法开具发票在金蝶云星空怎么操作
  • 快递费属于什么合同
  • 契税印花税计税方法
  • 开立个人银行账户的条件
  • 无形资产摊销怎么计算
  • 子公司注销是利空吗
  • 房地产企业开发成本科目明细
  • 销售退回 账务处理
  • 开票商品名称是什么意思
  • 小规模红字发票怎么做账务处理
  • 如何查询进项发票是否作废
  • 不能远程补报之前的税款所属期
  • 每个季度企业要缴纳什么税
  • 商票背书需要对方开发票吗
  • 年度汇算清缴可以作废吗
  • 房屋租赁税务局开票税点
  • 个人如何申报初级医师职称
  • 领用自产产品用于在建工程入账金额
  • 劳务收入不足800
  • 减免税备案申请表范文
  • 生产车间制造费用包括
  • 单位社保部分会扣吗
  • 呆账催讨原则是谁提出的
  • 人工装卸怎么办营业执照
  • 土地增值税计算例题
  • mplugin.exe是什么
  • 对外投资概述
  • php对二维数组进行排序
  • 稽查查补销售额后补开票如何申报
  • 激光器原理及应用
  • dhcp命令行
  • 出口增值税免抵退税
  • 个人独资企业怎么注销
  • 坏账准备计提范围包括
  • 公司少申报个税
  • 个税更正申报后可以撤销吗
  • phpcms建站教程
  • 不走流水开发票可以吗
  • mongodb doc
  • 织梦网站特有标识
  • 公司旅游费会计分录
  • sql的应用
  • 本年利润期末需要结转吗
  • 建筑业营改增的主要内容
  • 政府发的奖金需要交个税吗
  • 事业单位利息收入的正确分录
  • 劳务派遣如何做线上业务
  • 银行承兑的购买
  • 固定资产出售账面价值计入什么科目
  • 半成品仓库的管理办法
  • 所有者权益增加额怎么计算
  • 个体工商户建账流程
  • sqlserver关键字附近有语法错误
  • sql server 2005如何使用
  • win8.1电脑设置在哪里
  • centos7如何设置中文
  • centos san
  • win10快速切换到桌面快捷键
  • mac启动快捷键
  • linux crontab用法
  • win8 Could not load type System.ServiceModel.Activation.HttpModule 错误解决方案
  • cocos2dx 2.2.2
  • 作战仿真理论与技术
  • 铁嘴大师
  • js中script标签的作用
  • linux怎么添加新用户
  • 以下关于shell脚本参数
  • javascript零基础学要学多久
  • javascript内置对象应用团购
  • 批处理call命令
  • js的select()方法
  • shell脚本spool
  • jquery层次选择器主要包括哪几种分类
  • 现在的微信怎么用脚本登陆了
  • 什么是跨地区经营汇总纳税企业
  • 新都税务局咨询电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设