位置: IT常识 - 正文

yolov5优化器及超参数设置(yolov5网络优化)

编辑:rootadmin
yolov5优化器及超参数设置 文章目录前言一 优化器二 超参数参考前言一 优化器

推荐整理分享yolov5优化器及超参数设置(yolov5网络优化),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov5参数优化,yolov5 优化,yolov4优化,yolov5 改进,优化器参数,yolov5 优化,yolo算法优化,yolov5 优化,内容如对您有帮助,希望把文章链接给更多的朋友!

机器学习的五个步骤: 数据 -> 模型 -> 损失 -> 优化器 -> 迭代训练。 我们通过前向传播的过程,得到了模型输出与真实标签的差异,我们称之为损失, 有了损失,我们会进入反向传播过程得到参数的梯度,那么接下来就是优化器干活了,优化器要根据我们的这个梯度去更新参数,使得损失不断的降低。 那么优化器是怎么做到的呢? 该博主从三部分进行展开,首先是优化器的概念,然后是优化器的属性和方法,最后是常用的优化器。

深度学习优化算法经历了 SGD -> SGDM -> NAG ->AdaGrad -> AdaDelta -> Adam -> Nadam 这样的发展历程。该博主详细告诉你这些算法是如何一步一步演变而来的。

optim.SGD: 随机梯度下降法 optim.Adagrad: 自适应学习率梯度下降法 optim.RMSprop: Adagrad的改进 optim.Adadelta: Adagrad的改进 optim.Adam: RMSprop结合Momentum optim.Adamax: Adam增加学习率上限 optim.SparseAdam: 稀疏版的Adam optim.ASGD: 随机平均梯度下降 optim.Rprop: 弹性反向传播 optim.LBFGS: BFGS的改进

SGD:选择合适的learning rate比较困难 - 对所有的参数更新使用同样的learning rate.我们常用的mini-batch SGD训练算法,然而虽然这种算法能够带来很好的训练速度,但是在到达最优点的时候并不能够总是真正到达最优点,而是在最优点附近徘徊。另一个缺点就是这种算法需要我们挑选一个合适的学习率,当我们采用小的学习率的时候,会导致网络在训练的时候收敛太慢;当我们采用大的学习率的时候,会导致在训练过程中优化的幅度跳过函数的范围,也就是可能跳过最优点

yolov5优化器及超参数设置(yolov5网络优化)

SGD+Momentum:基于梯度的移动指数加权平均解决mini-batch SGD优化算法更新幅度摆动大的问题,同时可以使得网络的收敛速度更快(注意:使用Momentum时偏差修正可用可不用–吴恩达深度学习)

Momentum原理:积累之前的动量来替代真正的梯度,计算梯度的指数加权平均数,并利用该梯度更新权重,相关方向加速SGD,抑制振荡,从而加快收敛。

RMSprop:积累之前的动量来替代真正的梯度对梯度计算微分平方加权平均数,进一步优化损失函数在更新中存在摆动幅度过大的问题,并且进一步加快函数的收敛速度.(对学习率加了一定的约束,但事实上仍依赖于人工设置的一个全局学习率)

Adam:将Momentum算法和RMSProp算法结合起来使用的一种算法,表现比前两种更好,所以它也是解决摆动幅度过大,加快函数的收敛速度;同时利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,实现学习率自适应。(注意:在Adam中Momentum的偏差修正是必须使用的!)

parser.add_argument('--optimizer', type=str, choices=['SGD', 'Adam', 'AdamW'], default='SGD', help='optimizer')

实际上学术界上对于SGD和Adam哪个更好,一直没有统一的定论,取决于实际项目情况。

YOLO V5的作者建议是,如果需要训练较小的自定义数据集,Adam是更合适的选择,并且可以在较大的数据集上提供良好的初始结果,尽管Adam的学习率通常比SGD低(一般Adam为SGD的0.1倍)。但是 SGD 从长远来看往往会表现出色,尤其是训练大型数据集,并且似乎可以更好地推广到现实世界的结果。对于YOLOV5框架在VOC数据集的训练结果来说,效果:SGD > AdamW > Adam 。结果来自该issue。

SGD最大的缺点是下降速度慢,而且可能会在沟壑的两边持续震荡,停留在一个局部最优点。

所以,谈到现在,到底Adam好还是SGD好?这可能是很难一句话说清楚的事情。去看学术会议中的各种paper,用SGD的很多,Adam的也不少,还有很多偏爱AdaGrad或者AdaDelta。可能研究员把每个算法都试了一遍,哪个出来的效果好就用哪个了。毕竟paper的重点是突出自己某方面的贡献,其他方面当然是无所不用其极,怎么能输在细节上呢? 而从这几篇怒怼Adam的paper来看,多数都构造了一些比较极端的例子来演示了Adam失效的可能性。这些例子一般过于极端,实际情况中可能未必会这样,但这提醒了我们,理解数据对于设计算法的必要性。优化算法的演变历史,都是基于对数据的某种假设而进行的优化,那么某种算法是否有效,就要看你的数据是否符合该算法的胃口了。算法固然美好,数据才是根本。另一方面,Adam之流虽然说已经简化了调参,但是并没有一劳永逸地解决问题,默认的参数虽然好,但也不是放之四海而皆准。因此,在充分理解数据的基础上,依然需要根据数据特性、算法特性进行充分的调参。

二 超参数parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch.yaml', help='hyperparameters path')

超参数data/hyps/下有以下五个: 关于选择哪种,作者的解释是:

参考 SGD -> SGDM -> NAG ->AdaGrad -> AdaDelta -> Adam -> Nadam 发展历程YOLOv5-优化器和学习率调整策略https://pypi.org/project/torch-optimizer/
本文链接地址:https://www.jiuchutong.com/zhishi/284056.html 转载请保留说明!

上一篇:育空怀特霍斯附近的北极光,加拿大 (© Design Pics/Danita Delimont)

下一篇:bass.exe是什么进程 bass进程信息查询(bass boost system)

  • MacBookPro2021长什么样(macbookpro2021新款)

    MacBookPro2021长什么样(macbookpro2021新款)

  • 洋气的企业名字(洋气的qq名字)(好听企业名字)

    洋气的企业名字(洋气的qq名字)(好听企业名字)

  • 荣耀X30max怎么关闭应用(荣耀x30max怎么关掉虚尼键盘)

    荣耀X30max怎么关闭应用(荣耀x30max怎么关掉虚尼键盘)

  • siri的音量怎么调大小(siri音量怎么增大)

    siri的音量怎么调大小(siri音量怎么增大)

  • 抖音关注后自动消失(抖音关注后自动取消怎么办)

    抖音关注后自动消失(抖音关注后自动取消怎么办)

  • 400w电源能带rx580吗(400w电源能带rx580显卡吗)

    400w电源能带rx580吗(400w电源能带rx580显卡吗)

  • 华为手机如何共享热点(华为手机如何共享屏幕)

    华为手机如何共享热点(华为手机如何共享屏幕)

  • dns查找失败 无法上网(电脑显示dns查找失败怎么回事)

    dns查找失败 无法上网(电脑显示dns查找失败怎么回事)

  • wifi信号不稳定是什么原因(wifi信号不稳定,忽强忽弱怎么解决?)

    wifi信号不稳定是什么原因(wifi信号不稳定,忽强忽弱怎么解决?)

  • wifi是全双工还是半双工(无线网络全双工)

    wifi是全双工还是半双工(无线网络全双工)

  • 钉钉重新提交作业会显示时间吗(钉钉重新提交作业时间会变吗)

    钉钉重新提交作业会显示时间吗(钉钉重新提交作业时间会变吗)

  • 怎么p掉照片中不要的东西(怎么p掉照片中的背景)

    怎么p掉照片中不要的东西(怎么p掉照片中的背景)

  • 荣耀v20是什么屏(荣耀v20是什么屏幕)

    荣耀v20是什么屏(荣耀v20是什么屏幕)

  • vivo手机多大屏幕尺寸(vivo手机屏幕有多大)

    vivo手机多大屏幕尺寸(vivo手机屏幕有多大)

  • 华为手环只能连接华为手机吗(华为手环只能连华为吗)

    华为手环只能连接华为手机吗(华为手环只能连华为吗)

  • 太原公交可以刷支付宝吗(太原公交可以刷码吗)

    太原公交可以刷支付宝吗(太原公交可以刷码吗)

  • word怎么下载到电脑上(word怎么下载到u盘)

    word怎么下载到电脑上(word怎么下载到u盘)

  • 手机短信背景怎么设置(手机短信背景怎么换华为)

    手机短信背景怎么设置(手机短信背景怎么换华为)

  • 华为手机耳机模式在哪(华为手机耳机模式在哪里设置)

    华为手机耳机模式在哪(华为手机耳机模式在哪里设置)

  • qq音乐怎么设置手势密码(qq音乐怎么设置定时关闭)

    qq音乐怎么设置手势密码(qq音乐怎么设置定时关闭)

  • wps怎么删除有内容的页面(wps怎么删除内容保留表格)

    wps怎么删除有内容的页面(wps怎么删除内容保留表格)

  • 贵阳公车如何微信支付(贵阳公交车怎么微信支付)

    贵阳公车如何微信支付(贵阳公交车怎么微信支付)

  • 未接通是什么情况(未接通别人知道吗)

    未接通是什么情况(未接通别人知道吗)

  • win10管理无线网络在哪(w10管理无线网络在哪)

    win10管理无线网络在哪(w10管理无线网络在哪)

  • QQ音乐怎么清空列表(qq音乐怎么清空最近播放)

    QQ音乐怎么清空列表(qq音乐怎么清空最近播放)

  • 智联招聘如何添加简历(智联招聘如何添加协作人员)

    智联招聘如何添加简历(智联招聘如何添加协作人员)

  • 无线路由器怎么换天线 无线路由改装SMA天线接口的教程(无线路由器怎么连接)

    无线路由器怎么换天线 无线路由改装SMA天线接口的教程(无线路由器怎么连接)

  • 湖南个税申报系统app
  • 如何办理车辆购置置换补贴手续
  • 所得税费用怎么计提
  • 营业收入净额是营业总收入吗
  • 出口退税中的免抵税额可以认为是交的税吗
  • 法人的垫资在现金流量表中怎么填写
  • 损益类算费用吗
  • 高温补贴能以别的形式发放吗
  • 小规模纳税人出租
  • 金税盘年费全额抵扣分录
  • 缴纳城建税会计分录怎么做账
  • 原材料保险公司赔偿会计分录怎么写
  • 以前年度取得假发票账务处理
  • 网站服务器使用什么IP地址
  • 专票怎么提交不上去
  • 承兑汇票银行背书
  • 输入开票码开具电子发票
  • 农产品收购发票怎么做账
  • 资产负债表里应交税费里都包含什么
  • 发票查重
  • 分公司用总公司盖章说明
  • 季度申报利润表怎么填
  • 税务稽查补缴增值税税款的账务处理
  • 怎么解决笔记本电脑卡顿问题
  • 如何在windows中添加输入法
  • 桌面图标归纳
  • PHP:pg_convert()的用法_PostgreSQL函数
  • wordpress邮箱怎么配置
  • uniapp安装插件
  • 车辆违章罚款的钱上交到那了
  • php可以做什么脚本
  • yolo xml转txt
  • 小企业法人怎么交社保
  • 增值税报了所得税未报可以买发票吗
  • php使用mysql
  • PHP Ajax JavaScript Json获取天气信息实现代码
  • 外经证还有几天到期延期需要的资料
  • 帝国cms采集教程
  • 土地被政府收回会计分录
  • mongodb安装使用
  • etc如何取票据
  • 当月发生的费用
  • 不得开具增值税专用发票是什么意思
  • 生产性资金性质
  • 减免增值税优惠政策
  • SQL Server 2008 数据库有哪些版本?
  • mysql常见故障
  • 应收账款余额贷方
  • 公司充话费
  • 公司账户转法人个人账户需要交税吗
  • 资产负债表的作用体现在哪些方面
  • 借款合同相关法条
  • 建筑业增值税会退税吗
  • 差旅费住宿专票能否抵扣
  • 会计可以用收据做账吗
  • 金税盘开完发票可以直接拔掉吗?
  • shell多进程并行返回值
  • centos6.5mini安装教程
  • win7鼠标右键没有压缩文件
  • win8 开始
  • os x yosemite dp5下载地址 os x 10.10 dp5更新内容
  • linux中的用户管理主要涉及用户账号文件
  • linux编译安装php扩展命令
  • vi编辑器是干什么的
  • win8系统如何连接wifi
  • windowsxp设置语言
  • win7系统纯净版和旗舰版
  • win10系统保留分区可以删除吗
  • windows8网页版
  • linux中shell脚本编写
  • javascript typeof id==='string'?document.getElementById(id):id解释 原创
  • js移动到指定位置
  • jquery简写符号
  • unity ui
  • 基于jquery实现小说
  • 合肥税务局招聘信息
  • 内蒙古城镇土地使用税税率表
  • 中介服务行业
  • 岗位练兵的作用
  • 白酒消费税加征
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设