位置: IT常识 - 正文

yolov5优化器及超参数设置(yolov5网络优化)

编辑:rootadmin
yolov5优化器及超参数设置 文章目录前言一 优化器二 超参数参考前言一 优化器

推荐整理分享yolov5优化器及超参数设置(yolov5网络优化),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov5参数优化,yolov5 优化,yolov4优化,yolov5 改进,优化器参数,yolov5 优化,yolo算法优化,yolov5 优化,内容如对您有帮助,希望把文章链接给更多的朋友!

机器学习的五个步骤: 数据 -> 模型 -> 损失 -> 优化器 -> 迭代训练。 我们通过前向传播的过程,得到了模型输出与真实标签的差异,我们称之为损失, 有了损失,我们会进入反向传播过程得到参数的梯度,那么接下来就是优化器干活了,优化器要根据我们的这个梯度去更新参数,使得损失不断的降低。 那么优化器是怎么做到的呢? 该博主从三部分进行展开,首先是优化器的概念,然后是优化器的属性和方法,最后是常用的优化器。

深度学习优化算法经历了 SGD -> SGDM -> NAG ->AdaGrad -> AdaDelta -> Adam -> Nadam 这样的发展历程。该博主详细告诉你这些算法是如何一步一步演变而来的。

optim.SGD: 随机梯度下降法 optim.Adagrad: 自适应学习率梯度下降法 optim.RMSprop: Adagrad的改进 optim.Adadelta: Adagrad的改进 optim.Adam: RMSprop结合Momentum optim.Adamax: Adam增加学习率上限 optim.SparseAdam: 稀疏版的Adam optim.ASGD: 随机平均梯度下降 optim.Rprop: 弹性反向传播 optim.LBFGS: BFGS的改进

SGD:选择合适的learning rate比较困难 - 对所有的参数更新使用同样的learning rate.我们常用的mini-batch SGD训练算法,然而虽然这种算法能够带来很好的训练速度,但是在到达最优点的时候并不能够总是真正到达最优点,而是在最优点附近徘徊。另一个缺点就是这种算法需要我们挑选一个合适的学习率,当我们采用小的学习率的时候,会导致网络在训练的时候收敛太慢;当我们采用大的学习率的时候,会导致在训练过程中优化的幅度跳过函数的范围,也就是可能跳过最优点

yolov5优化器及超参数设置(yolov5网络优化)

SGD+Momentum:基于梯度的移动指数加权平均解决mini-batch SGD优化算法更新幅度摆动大的问题,同时可以使得网络的收敛速度更快(注意:使用Momentum时偏差修正可用可不用–吴恩达深度学习)

Momentum原理:积累之前的动量来替代真正的梯度,计算梯度的指数加权平均数,并利用该梯度更新权重,相关方向加速SGD,抑制振荡,从而加快收敛。

RMSprop:积累之前的动量来替代真正的梯度对梯度计算微分平方加权平均数,进一步优化损失函数在更新中存在摆动幅度过大的问题,并且进一步加快函数的收敛速度.(对学习率加了一定的约束,但事实上仍依赖于人工设置的一个全局学习率)

Adam:将Momentum算法和RMSProp算法结合起来使用的一种算法,表现比前两种更好,所以它也是解决摆动幅度过大,加快函数的收敛速度;同时利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,实现学习率自适应。(注意:在Adam中Momentum的偏差修正是必须使用的!)

parser.add_argument('--optimizer', type=str, choices=['SGD', 'Adam', 'AdamW'], default='SGD', help='optimizer')

实际上学术界上对于SGD和Adam哪个更好,一直没有统一的定论,取决于实际项目情况。

YOLO V5的作者建议是,如果需要训练较小的自定义数据集,Adam是更合适的选择,并且可以在较大的数据集上提供良好的初始结果,尽管Adam的学习率通常比SGD低(一般Adam为SGD的0.1倍)。但是 SGD 从长远来看往往会表现出色,尤其是训练大型数据集,并且似乎可以更好地推广到现实世界的结果。对于YOLOV5框架在VOC数据集的训练结果来说,效果:SGD > AdamW > Adam 。结果来自该issue。

SGD最大的缺点是下降速度慢,而且可能会在沟壑的两边持续震荡,停留在一个局部最优点。

所以,谈到现在,到底Adam好还是SGD好?这可能是很难一句话说清楚的事情。去看学术会议中的各种paper,用SGD的很多,Adam的也不少,还有很多偏爱AdaGrad或者AdaDelta。可能研究员把每个算法都试了一遍,哪个出来的效果好就用哪个了。毕竟paper的重点是突出自己某方面的贡献,其他方面当然是无所不用其极,怎么能输在细节上呢? 而从这几篇怒怼Adam的paper来看,多数都构造了一些比较极端的例子来演示了Adam失效的可能性。这些例子一般过于极端,实际情况中可能未必会这样,但这提醒了我们,理解数据对于设计算法的必要性。优化算法的演变历史,都是基于对数据的某种假设而进行的优化,那么某种算法是否有效,就要看你的数据是否符合该算法的胃口了。算法固然美好,数据才是根本。另一方面,Adam之流虽然说已经简化了调参,但是并没有一劳永逸地解决问题,默认的参数虽然好,但也不是放之四海而皆准。因此,在充分理解数据的基础上,依然需要根据数据特性、算法特性进行充分的调参。

二 超参数parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch.yaml', help='hyperparameters path')

超参数data/hyps/下有以下五个: 关于选择哪种,作者的解释是:

参考 SGD -> SGDM -> NAG ->AdaGrad -> AdaDelta -> Adam -> Nadam 发展历程YOLOv5-优化器和学习率调整策略https://pypi.org/project/torch-optimizer/
本文链接地址:https://www.jiuchutong.com/zhishi/284056.html 转载请保留说明!

上一篇:育空怀特霍斯附近的北极光,加拿大 (© Design Pics/Danita Delimont)

下一篇:bass.exe是什么进程 bass进程信息查询(bass boost system)

  • 微信状态听歌怎么添加QQ音乐歌曲(微信状态听歌怎么取消掉)

    微信状态听歌怎么添加QQ音乐歌曲(微信状态听歌怎么取消掉)

  • 微信注销后好友还可以看到我吗(微信注销后好友会自动删除吗)

    微信注销后好友还可以看到我吗(微信注销后好友会自动删除吗)

  • 快手怎么改无性别(快手如何从新设置)

    快手怎么改无性别(快手如何从新设置)

  • wps中嵌入本地视频无法播放(wps嵌入本地视频)

    wps中嵌入本地视频无法播放(wps嵌入本地视频)

  • 直播云怎么进课堂(直播云怎么操作)

    直播云怎么进课堂(直播云怎么操作)

  • iphone黑名单短信恢复怎么办(iphone黑名单短信保留吗)

    iphone黑名单短信恢复怎么办(iphone黑名单短信保留吗)

  • k歌屏蔽和拉黑的区别(k歌拉黑对方看我主页我知道吗)

    k歌屏蔽和拉黑的区别(k歌拉黑对方看我主页我知道吗)

  • 华为四个摄像头有啥用(华为四个摄像头中间闪光灯是什么型号的)

    华为四个摄像头有啥用(华为四个摄像头中间闪光灯是什么型号的)

  • 苹果7p电池能给8p用吗(苹果7p电池能给8用吗)

    苹果7p电池能给8p用吗(苹果7p电池能给8用吗)

  • oppo手机不能上网怎么回事(oppo手机不能上传照片原因)

    oppo手机不能上网怎么回事(oppo手机不能上传照片原因)

  • 咸鱼上卖家保障服务怎么开通(咸鱼上卖家保障是真的吗)

    咸鱼上卖家保障服务怎么开通(咸鱼上卖家保障是真的吗)

  • 手机支付宝账户修改密码(手机支付宝账户通在哪)

    手机支付宝账户修改密码(手机支付宝账户通在哪)

  • 手机wps怎么删除多余页(手机wps怎么删除不需要的页)

    手机wps怎么删除多余页(手机wps怎么删除不需要的页)

  • 网页怎么制作(个人网页怎么制作)

    网页怎么制作(个人网页怎么制作)

  • 网课要过期了怎么下载(网课要过期了怎么保存作业帮)

    网课要过期了怎么下载(网课要过期了怎么保存作业帮)

  • 怎么给视频加背景音乐(怎么给视频加背景动画)

    怎么给视频加背景音乐(怎么给视频加背景动画)

  • 苹果抖音怎么看完整版(苹果抖音怎么看我@别人的视频)

    苹果抖音怎么看完整版(苹果抖音怎么看我@别人的视频)

  • qq封号七天怎么提前解除(qq封号七天怎么才能解除)

    qq封号七天怎么提前解除(qq封号七天怎么才能解除)

  • 微信收款码怎么停用(微信收款码怎么关闭收款功能)

    微信收款码怎么停用(微信收款码怎么关闭收款功能)

  • 抖音里怎么把视频和照片合在一起(抖音里怎么把视频剪短)

    抖音里怎么把视频和照片合在一起(抖音里怎么把视频剪短)

  • win10excel变成英文了(window10excel表格英文变中文)

    win10excel变成英文了(window10excel表格英文变中文)

  • 主板电池没电(主板电池没电能开机吗)

    主板电池没电(主板电池没电能开机吗)

  • dat文件用什么软件打开(电脑dat文件怎么打开)

    dat文件用什么软件打开(电脑dat文件怎么打开)

  • 在犹他州峡谷地国家公园中看到的银河 (© Cavan Images/Offset)(犹他州现神秘物体)

    在犹他州峡谷地国家公园中看到的银河 (© Cavan Images/Offset)(犹他州现神秘物体)

  • 使用uni-app开发App简易教程(使用uni-app开发网站)

    使用uni-app开发App简易教程(使用uni-app开发网站)

  • 设计印刷合同
  • 居民个人的综合所得
  • 税务筹划的基本前提是
  • 办理税务登记需要法人身份证原件吗
  • 营业费用和管理费用比较
  • 小规模什么情况下只交城建税
  • 支出和成本的关系和区别
  • 税控服务费抵税
  • 企业所得税不征税收入
  • 技术转让所得的税收优惠
  • 期房购置税怎么算
  • 房地产企业回迁安置房税收规定
  • 公司冲账发票做不够该如何处理合适?
  • 其他流动资产的构成
  • 查补以前年度所得税如何填写申报表
  • 公对公转账需要多久到账
  • 个人去税务局开票流程
  • 企业所得税营业利润怎么算
  • 取得抵债房产的涉税风险,你清楚吗?
  • 2021年个体工商户的税率是多少
  • 个人独资企业取得的股息红利
  • 汇算清缴工资调增,账务要处理吗
  • 小规模纳税人个税怎么申报
  • 收到以前年度退回的企业所得税
  • 土地合并需要什么资料
  • 预付业务招待费会计分录
  • 货物损坏补发会计分录
  • 深入分析php引用文献
  • dreamweaver 是什么
  • 多枝发财树怎么修剪
  • php imagestring
  • 我想看阿尔伯塔
  • 交易性金融资产的账务处理
  • php import
  • taro-ui-vue3
  • 独立核算的基金是会计主体吗
  • 营业外支出会计准则
  • 小程序开发定制
  • 赫尔辛基哈加赫利亚大学
  • php语言设计模式之单例模式
  • h5的开发
  • php simple html dom parser
  • 发行股票溢价计入
  • 主营业务收入和营业外收入的区别
  • 技术服务的范围
  • 人力资源投资收益
  • 网上学电脑
  • 积分兑换业务有风险吗
  • 差旅费津贴属于应付职工薪酬吗
  • 所得税申报表的营业成本包括哪些
  • 事业单位结余是什么意思
  • 土地使用税怎么征收标准
  • 本月无进项发票需要去增值税发票认证平台吗
  • 国有资本金是什么意思
  • 商品流通企业如何控成本
  • 房地产项目企业
  • Windows10下MySQL5.7.19安装教程 MySQL忘记root密码修改方法
  • sql server中事务有哪三种语句
  • mysql单表10亿
  • Win10 Mobile/PC Build 10586.550曝光:主要修复bug和优化性能
  • macos 音量快捷键
  • win7怎么关闭自带键盘
  • windows8设置
  • linux中的
  • 3d引擎开发
  • 怎么在dos下运行
  • unity 读取txt
  • Node.js中的construct构造函数
  • linux c 线程池
  • 在javascript中如何定义并调用函数
  • 咸阳国税局长是哪里人
  • 银行流水怎么查
  • 河南省个人无犯罪证明书
  • 国家税务总局公告2022年第9号
  • 社保工资申报错了可以重新申请吗
  • 安徽公务员流程各个阶段时间
  • 柬埔寨现在的领导
  • 怎么查询公司法人电话号码
  • 主要领导负责人
  • 轮胎消费税的征收环节
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设