位置: IT常识 - 正文

模型调优:验证集的作用(就是为了调整超参数)(模型如何优化)

编辑:rootadmin
模型调优:验证集的作用(就是为了调整超参数) 一、总结一句话总结:验证集的作用就是为了调整超参数1、超参数?

推荐整理分享模型调优:验证集的作用(就是为了调整超参数)(模型如何优化),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:模型参数调优,模型调参调的是什么,模型参数优化方法,模型如何优化,模型的调整,模型的调整,模型的调整,模型的调整,内容如对您有帮助,希望把文章链接给更多的朋友!

【超参数的值不是学习出来的】:大多数机器学习算法都有超参数,可以设置来控制算法行为。超参数的值不是通过学习算法本身学习出来的。

【超参数如果学习太难优化】:有时一个选项被设为学习算法不用学习的超参数,是因为它太难优化了。更多的情况是该选项必须是超参数,是因为它不适合在训练集上学习。

【超参数是我们自己设定的】:这适用于控制模型容量的所有超参数。如果在训练集上学习超参数,这些超参数总是趋向于最大可能的模型容量,导致过拟合。

2、如何解决超参数设置的问题?

【验证集样本】:为了解决解决超参数设置的问题,我们需要一个训练算法观测不到的验证集样本。

3、测试集不能帮助改善超参数?

【测试样本不能以任何形式参与到模型的选择之中,包括超参数的设定】:测试集可以用来估计学习过程完成之后的学习器的泛化误差,其重点在于测试样本不能以任何形式参与到模型的选择之中,包括超参数的设定,基于这个原因,测试集中的样本不能用于验证集。

【验证集帮助改善超参数】:因此,我们总是从训练数据中构建验证集。用于估计训练中或训练后的泛化误差,更新超参数。

4、模型超参数一般有哪些?

例如学习速率和特征等等

5、验证集是验证还是训练?

训练集用于训练模型的参数,验证集用于训练模型的超参数。不同超参数(hyper-parameter)组合,就对应着不同的潜在模型。验证集上跑的,实际上是一个模型集合,验证集的存在,就是为了从这一堆可能的模型中,找出表现最好的那个。

6、超参数重要性?

超参数包括训练轮数,学习速率等等。如果一个模型,训练数据比别人多得多,效果就会很好(参数训练的很到位),但是模型的架构(超参数设定)未必比别人好。

7、为什么不能在训练集上训练超参数?

好比训练轮数(epochs),在同样的训练集上,训练3轮和训练10轮,结果肯定是不一样的模型。它们的参数并不相同。那么到底是训练3轮好,还是10轮好?或者二者都不好,应该训练6轮?这种决策,只能在训练后,在验证集上见分晓。一般训练几个 epoch 就跑一次验证看看效果,如果发现训练3轮效果更好,那么就应该丢弃掉训练6轮、10轮的潜在模型,只用训练3轮的结果。

再好比网络层数,在训练集上训练的时候肯定是层数越多,拟合效果越好。如果你这样选出你的模型,在验证集上的效果肯定是差很多,这就是过拟合啦。所以必须从训练样本中取出一部分样本,即验证集,让模型训练的过程看不到这些样本,然后评估模型在这一部分样本中的表现,最终选出合适的网络层数。

其他的超参数选取,你也可以举一反三。总之就是按照验证集的效果,来选超参数,从而决定最终模型。

总结一下:在验证集上相当于手动调参(在训练集上是通过误差逆传播自动调参) 

下一步,把模型交给测试集去检验。测试集应该既不同于训练集,又不同于验证集。至于这个最终选择模型,在测试集上表现如何,没人能打包票。就像你模拟考试考得很好了,高考也可能翻车。

模型调优:验证集的作用(就是为了调整超参数)(模型如何优化)

怎样划分验证集

怎么设定验证集,划分多少数据做验证,其实是每个研究者需要独立作出的决策,不应该强行设定为一致。

10折交叉验证(10-fold Cross Validation)

选择固定训练集和测试集可能会出现划分偏差

因此将数据集随机分成10份,使用其中9份进行训练而将另外1份用作测试。该过程可以重复10次,每次使用的测试数据不同。

好处一是随即划分减小误差,二是每次采用90%的训练数据而不是2折交叉验证中仅仅50%的数据。

二、超参数和验证集

大多数机器学习算法都有超参数,可以设置来控制算法行为。超参数的值不是通过学习算法本身学习出来的。

有时一个选项被设为学习算法不用学习的超参数,是因为它太难优化了。更多的情况是该选项必须是超参数,是因为它不适合在训练集上学习。这适用于控制模型容量的所有超参数。如果在训练集上学习超参数,这些超参数总是趋向于最大可能的模型容量,导致过拟合。

为了解决这个问题,我们需要一个训练算法观测不到的验证集样本。

测试集可以用来估计学习过程完成之后的学习器的泛化误差,其重点在于测试样本不能以任何形式参与到模型的选择之中,包括超参数的设定,基于这个原因,测试集中的样本不能用于验证集。因此,我们总是从训练数据中构建验证集。特别地,我们将训练数据分成两个不相交的子集。其中一个用于学习参数。另一个作为验证集,用于估计训练中或训练后的泛化误差,更新超参数。用于学习参数的数据子集通常仍被称为训练集,尽管这会和整个训练过程用到的数据集相混。用于挑选超参数的数据子集被称为验证集。

使用测试集和训练集来推动模型开发迭代的流程。在每次迭代时,我们都会对训练诗句进行训练并评估测试数据,兵以基于测试数据的评估结果为指导来选择和更改各种模型超参数,例如学习速率和特征,这种方法是否存在问题?

存在,我们基于给定测试集执行评估的次数越多,不知不觉的过拟合该测试集的风险就越高。

将数据集划分为三个自己可以大幅度降低过拟合的发生几率。

该工作流程之所以更好,是因为它暴露给测试集的信息更少。

不断使用测试集和验证集会使其逐渐失去效果。也就是说,您使用相同数据来决定超参数设置或其他模型改进的次数越多,您对于这些结果能够真正泛化到未见过的新数据的信心就越低。请注意,验证集的失效速度通常比测试集缓慢。

如果可能的话,建议您收集更多数据来“刷新”测试集和验证集。重新开始是一种很好的重置方式。

验证集真正作用 - 范仁义 - 博客园

验证集到底有什么作用_anyanyanyway的博客-CSDN博客_验证集的作用

本文链接地址:https://www.jiuchutong.com/zhishi/296034.html 转载请保留说明!

上一篇:AI:DeepSpeed Chat(一款帮用户训练自己模型的工具且简单/低成本/快 RLHF 训练类ChatGPT高质量大模型)的简介、安装、使用方法之详细攻略

下一篇:web前端面试高频考点——Vue原理(理解MVVM模型、深度/监听data变化、监听数组变化、深入了解虚拟DOM)(web前端面试常见问题)

  • 国家企业信用信息公示系统登录收不到验证码?

    国家企业信用信息公示系统登录收不到验证码?

  • 荣耀magic3至臻版和华为p50pro怎么选(荣耀magic3至臻版和magic5哪个好)

    荣耀magic3至臻版和华为p50pro怎么选(荣耀magic3至臻版和magic5哪个好)

  • 支付宝上的行程记录在哪里(支付宝上的行程卡打不开怎么回事)

    支付宝上的行程记录在哪里(支付宝上的行程卡打不开怎么回事)

  • 苹果13怎么调铃声大小(苹果13怎么调铃声跟震动声)

    苹果13怎么调铃声大小(苹果13怎么调铃声跟震动声)

  • 华为手机怎么修改屏下指纹图案(华为手机怎么修改日期)

    华为手机怎么修改屏下指纹图案(华为手机怎么修改日期)

  • xr怎么长截屏(xr怎么长截图)

    xr怎么长截屏(xr怎么长截图)

  • 天猫超市漏发货怎么办(天猫超市发货漏发)

    天猫超市漏发货怎么办(天猫超市发货漏发)

  • iphone11pro拍照发黄(iphone11pro拍照为什么模糊)

    iphone11pro拍照发黄(iphone11pro拍照为什么模糊)

  • 笔记本连不上WIFI怎么办(笔记本连不上wifi但是手机可以连接)

    笔记本连不上WIFI怎么办(笔记本连不上wifi但是手机可以连接)

  • oppor17换屏后指纹不能用(oppor17换屏后指纹不能用什么原因)

    oppor17换屏后指纹不能用(oppor17换屏后指纹不能用什么原因)

  • 什么软件可以给视频美颜(什么软件可以给证件照换底色)

    什么软件可以给视频美颜(什么软件可以给证件照换底色)

  • 微信视频开美颜怎么开(微信视频开美颜对方看到的是美颜效果吗)

    微信视频开美颜怎么开(微信视频开美颜对方看到的是美颜效果吗)

  • 三星手机系统更新对手机有没有影响(三星手机系统更新好吗)

    三星手机系统更新对手机有没有影响(三星手机系统更新好吗)

  • cad2012安装失败原因(cad2012安装失败c++2005)

    cad2012安装失败原因(cad2012安装失败c++2005)

  • isp用户名和密码在哪里(isp用户名和密码是什么格式)

    isp用户名和密码在哪里(isp用户名和密码是什么格式)

  • ipad购买日期未验证什么意思(ipad购买日期未验证是翻新机吗)

    ipad购买日期未验证什么意思(ipad购买日期未验证是翻新机吗)

  • 笔记本电脑上网课需要用麦吗(笔记本电脑上网的几种方式)

    笔记本电脑上网课需要用麦吗(笔记本电脑上网的几种方式)

  • 华为手机屏幕上的返回键在哪设置(华为手机屏幕上的时间和日期怎么调出来)

    华为手机屏幕上的返回键在哪设置(华为手机屏幕上的时间和日期怎么调出来)

  • 塞罕坝在哪里(塞罕坝在哪里?塞罕坝景区有什么好玩的?怎样去塞罕坝?)

    塞罕坝在哪里(塞罕坝在哪里?塞罕坝景区有什么好玩的?怎样去塞罕坝?)

  • 小米6支持o丅g功能吗(小米6支持4g+)

    小米6支持o丅g功能吗(小米6支持4g+)

  • vivoy93怎样调返回键(vivoy93s如何设置返回)

    vivoy93怎样调返回键(vivoy93s如何设置返回)

  • 小米手机导航键设置(小米手机导航键在哪里)

    小米手机导航键设置(小米手机导航键在哪里)

  • 路由器用户名和密码是什么(路由器用户名和密码忘了怎么查)

    路由器用户名和密码是什么(路由器用户名和密码忘了怎么查)

  • 国内外人工智能AI工具网站大全(一键收藏,应有尽有)(国内外人工智能发展现状,及最新的人工智能应用?)

    国内外人工智能AI工具网站大全(一键收藏,应有尽有)(国内外人工智能发展现状,及最新的人工智能应用?)

  • 前端基本知识介绍(前端基础)

    前端基本知识介绍(前端基础)

  • 应付账款转资本公积
  • 增量留抵退税会计处理
  • 党建经费提取比例10%
  • 年末为什么要结转应付现金股利
  • 暂估库存商品比发票少1分怎么记账
  • 长期应付款是什么科目 借方
  • 建设工程材料检测费
  • 招标文件费属于哪类税收编码
  • 利用废旧物资生产设备
  • 一般纳税人取得3%专票可以抵扣吗
  • 增值税普通发票查询真伪
  • 出口退税申报系统汇率修改
  • 返利红字发票怎么做账
  • 收到微信公众号退款怎么做账
  • 哪些费用可以计入待摊费用
  • 施工工人个税怎么计算?
  • 固定资产评估是什么单位
  • 增值税专票盖章正确位置
  • 开票税率选错申报增值税时怎么处理
  • 个税当月计提还是下月
  • 资产处置损益借贷方向表示什么
  • 地铁充值发票能报销吗
  • 装修工程需要预缴吗
  • 政府装修补贴政策
  • windos10不显示桌面
  • 企业支出的辞退补偿金
  • 丢失空白发票怎么处罚
  • 企业所得税汇算清缴补缴税款分录
  • 没收的定金 会计分录
  • dpi鼠标按键是什么意思
  • 企业长期借款的利息,有可能计入的科目有( )
  • 确认坏账的会计处理
  • 试运行期间收入和成本怎么记账
  • 增值税发票超额后税率
  • css如何实现文字环绕
  • php正则表达式匹配字符串
  • php如何实现
  • mmdetection ValueError: need at least one array to concatenate解决方案
  • cvpr best
  • 手撕代码是啥意思
  • python中拼接
  • 金税盘全额抵扣政策
  • 为什么其他权益工具投资不计提减值准备
  • 将织梦dedecms转换到wordpress
  • 小型微利企业符合条件的有
  • 冷饮成本价
  • 小规模开劳务费可以开多少
  • 织梦下载站源码带采集
  • mysql5.7.23安装配置教程
  • 员工加班打车费报销
  • 承兑汇票可以当现金用吗
  • 免征文化事业建设费条件的销售额标准
  • 工业企业存货核算方法
  • 增值税专用发票和普通发票的区别
  • 收到金融服务费发票会计分录怎么写
  • 应付职工薪酬余额方向
  • 失控发票要补交所得税吗
  • 所得税汇算清缴退税会计分录怎么做
  • 餐饮娱乐服务员
  • 结转损益主营业务收入在借方
  • 监控 固定资产
  • 企业比赛奖金要交税吗
  • 工程预付款的数量取决于
  • 资产减值损失属于营业外支出吗
  • 数据库中两张表tab1
  • mysql 5.5 5.6
  • windows怎么查看
  • arp攻击的原理及防范
  • win10系统d盘变成e盘,进入winpe盘符正常
  • centos关闭gui
  • windows8怎么设置
  • 安卓opengl es
  • node执行js文件的命令是什么
  • js按照指定顺序排序
  • 网站渗透违法吗
  • Python中http请求方法库汇总
  • 安卓手机管家怎么关闭
  • js-cookie vue
  • js创建对象的几种方式
  • 什么是财务舞弊行为
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设