位置: IT常识 - 正文

机器学习中的数学原理——过拟合、正则化与惩罚函数

编辑:rootadmin
机器学习中的数学原理——过拟合、正则化与惩罚函数

推荐整理分享机器学习中的数学原理——过拟合、正则化与惩罚函数,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

通过这篇博客,你将清晰的明白什么是过拟合、正则化、惩罚函数。这个专栏名为白话机器学习中数学学习笔记,主要是用来分享一下我在 机器学习中的学习笔记及一些感悟,也希望对你的学习有帮助哦!感兴趣的小伙伴欢迎私信或者评论区留言!这一篇就更新一下《 白话机器学习中的数学——过拟合、正则化与惩罚函数》

文章目录一、过拟合二、正则化2.1 正则化的方法2.2 正则化的效果三、惩罚函数一、过拟合机器学习中的数学原理——过拟合、正则化与惩罚函数

之前我们提到过的模型只能拟合训练数据的状态被称为过拟合,英文是 overfitting。记得在学习回归的时候,过度增加函数 fθ(x)的次数会导致过拟合。过拟合不止在回归时出现,在分类时也经常发生,我们要时常留意它。 避免过拟合有以下方法:

增加全部训练数据的数量使用简单的模型正则化

首先,重要的是增加全部训练数据的数量。之前我也讲过,机器学习是从数据中学习的,所以数据最重要。另外,使用更简单的模型也有助于防止过拟合。

二、正则化2.1 正则化的方法

还记得我们在讲解回归的时候提到的目标函数吗? 我们要向这个目标函数增加下面这样的正则化项: 那么现在的E(θ)E(\boldsymbol{\theta})E(θ)就变为: 我们要对这个新的目标函数进行最小化,这种方法就称为正则化。 m 是参数的个数,不过一般来说不对 θ0 应用正则化。所以仔细看会发现 j 的取值是从 1 开始的。也就是说,假如预测函数的表达式为 fθ(x) = θ0 + θ1x + θ2x2,那么 m = 2 就意味着正则化的对象参数为 θ1 和 θ2,θ0 这种只有参数的项称为偏置项,一般不对它进行正则化。λ 是决定正则化项影响程度的正的常数。这个值需要我们自己来定。

2.2 正则化的效果

光看表达式可能不容易理解。我们结合图来想象一下吧:首先把目标函数分成两个部分。 C(θ) 是本来就有的目标函数项,R(θ) 是正则化项。 C(θ) 和 R(θ) 相加之后就是新的目标函数,所以我们实际地把这两个函数的图形画出来,加起来看看。不过参数太多就画不出图来了,所以这里我们只关注 θ1。而且为了更加易懂,先不考虑 λ。 我们先从C(θ) 开始画起,不用太在意形状是否精确。在讲回归的时候,我们说过这个目 标函数开口向上,还记得吗?所以,我们假设它的形状是这样的:

从图中马上就可以看出最小值在哪里,是在θ1 = 4.5 附近。 从这个目标函数在没有正则化项时的形状来看,θ1 = 4.5 附近是最小值。接下来是 R(θ),它就相当于12θ12\frac{1}{2} \theta_1^221​θ12​所以是过原点的简单二次函数。 实际的目标函数是这两个函数之和E(θ) = C(θ) + R(θ),我们来画一下它的图形。顺便考虑一下最小值在哪里。把 θ1 各点上的 C(θ) 和 R(θ) 的高相加,然后用线把它们相连就好: 从图中我们可以看出来最小值是 θ1 = 0.9,与加正则化项之前相比,θ1 更接近 0 了。本来是在 θ1 = 4.5 处最小,现在是在 θ1 = 0.9 处最小,的确更接近 0 了。这就是正则化的效果。它可以防止参数变得过大,有助于参数接近较小的值。虽然我们只考虑了 θ1,但其他 θj 参数的情况也是类似的。 参数的值变小,意味着该参数的影响也会相应地变小。比如,有这样的一个预测函数 fθ(x):fθ(x)=θ+θ1x+θ2x2f_{\boldsymbol{\theta}}(\boldsymbol{x})=\theta_0+\theta_1 x+\theta_2 x^2fθ​(x)=θ0​+θ1​x+θ2​x2 极端一点,假设 θ2 = 0,这个表达式就从二次变为一次了,这就意味着本来是曲线的预测函数变为直线了: 这正是通过减小不需要的参数的影响,将复杂模型替换为简单模型来防止过拟合的方式。

三、惩罚函数

为了防止参数的影响过大,在训练时要对参数施加一些惩罚。比如上面提到的 λ,可以控制正则化惩罚的强度。C(θ)=12∑i=1n(y(i)−fθ(x(i)))2R(θ)=λ2∑j=1mθj2\begin{aligned} & C(\boldsymbol{\theta})=\frac{1}{2} \sum_{i=1}^n\left(y^{(i)}-f_{\boldsymbol{\theta}}\left(\boldsymbol{x}^{(i)}\right)\right)^2 \\ & R(\boldsymbol{\theta})=\frac{\lambda}{2} \sum_{j=1}^m \theta_j^2 \end{aligned}​C(θ)=21​i=1∑n​(y(i)−fθ​(x(i)))2R(θ)=2λ​j=1∑m​θj2​​ 比如令 λ = 0,那就相当于不使用正则化 λ 越大,正则化的惩罚也就越严厉:

本文链接地址:https://www.jiuchutong.com/zhishi/299255.html 转载请保留说明!

上一篇:Web 攻防之业务安全:密码找回安全案例总结.(web攻防之业务安全实战指南在线阅读)

下一篇:Content Security Policy (CSP) 介绍(content security policy blob)

  • 好看的火星文网名(好看的火星文符号)(好看的火星文网名男绝情狼)

    好看的火星文网名(好看的火星文符号)(好看的火星文网名男绝情狼)

  • 小米如何分屏(小米如何分屏幕)

    小米如何分屏(小米如何分屏幕)

  • iphone12解锁声音开启(苹果12声音解锁)

    iphone12解锁声音开启(苹果12声音解锁)

  • vivo x6s A输入法设置在哪里(vivox9输入法)

    vivo x6s A输入法设置在哪里(vivox9输入法)

  • 腾讯课堂后台播放老师知道吗

    腾讯课堂后台播放老师知道吗

  • 华为手机怎么设置相册加密(华为手机怎么设置锁屏密码)

    华为手机怎么设置相册加密(华为手机怎么设置锁屏密码)

  • 华为手机屏幕时长怎么设置(华为手机屏幕时间不见了怎么弄回来)

    华为手机屏幕时长怎么设置(华为手机屏幕时间不见了怎么弄回来)

  • ios14支持那些机型(ios14支持的手机型号)

    ios14支持那些机型(ios14支持的手机型号)

  • ipad能设置儿童模式吗(ipad儿童设置)

    ipad能设置儿童模式吗(ipad儿童设置)

  • 华为手机黑屏拍不了照(华为手机黑屏拍照怎么办)

    华为手机黑屏拍不了照(华为手机黑屏拍照怎么办)

  • 手机空号是什么意思(怎么知道手机的手机号)

    手机空号是什么意思(怎么知道手机的手机号)

  • 华为p30欧版和国行的区别(p30欧版和国行一样吗)

    华为p30欧版和国行的区别(p30欧版和国行一样吗)

  • 有锁机黑解是什么意思(有锁机黑解完就没事了吗)

    有锁机黑解是什么意思(有锁机黑解完就没事了吗)

  • ipad可以用otg吗(ipad能用usb吗)

    ipad可以用otg吗(ipad能用usb吗)

  • 手机蓝屏开不了机怎么办(手机蓝屏开不了机要换屏吗)

    手机蓝屏开不了机怎么办(手机蓝屏开不了机要换屏吗)

  • 如何删除华为手机自带的软件(如何删除华为手机使用时间记录)

    如何删除华为手机自带的软件(如何删除华为手机使用时间记录)

  • 手机屏幕漏液是内屏还是外屏(手机屏幕漏液是什么原因)

    手机屏幕漏液是内屏还是外屏(手机屏幕漏液是什么原因)

  • 怎样通过qq号找微信号(怎样通过qq号找抖音号)

    怎样通过qq号找微信号(怎样通过qq号找抖音号)

  • 微机系统中的内存条是(在微机系统中什么的内存容量最大)

    微机系统中的内存条是(在微机系统中什么的内存容量最大)

  • 拼多多可以改店名吗(拼多多可以改店铺名字改行业名吗)

    拼多多可以改店名吗(拼多多可以改店铺名字改行业名吗)

  • ie设置在哪里(ie页面设置在哪里找?)

    ie设置在哪里(ie页面设置在哪里找?)

  • 小黑记事本是干什么的(小黑记事本是干嘛的)

    小黑记事本是干什么的(小黑记事本是干嘛的)

  • 如何给airpod改名字(怎么给air pods改名字)

    如何给airpod改名字(怎么给air pods改名字)

  • 系统提示打印机错误(打印机疑难解答显示打印机问题)

    系统提示打印机错误(打印机疑难解答显示打印机问题)

  • (二)元学习算法MAML简介及代码分析(二元运算例子)

    (二)元学习算法MAML简介及代码分析(二元运算例子)

  • 税务申报系统没有印花税
  • 其他收益科目在哪个科目前面填
  • 开了票印花税必须报吗
  • 实发工资知道如何发放吗
  • 小额贷款公司的钱从哪里来
  • 资产负债表中存货项目金额怎么算
  • 收款未发货需要纳税吗
  • 汇算清缴补交需要调报表吗
  • 公司转投资的额度
  • 费用的完成率怎么计算
  • 销售原材料的账务处理
  • 代收房款
  • 简易计税是否可以开增值税专用发票
  • 新成立的分公司怎么样
  • 开发票税收分类编码怎么选
  • 季报进入国税官网后怎么操作?
  • 员工疗养要扣公休假吗
  • 自产产品公益性捐赠可以免征增值税吗
  • 出口退税限额如何理解
  • 企业所得税法如何确认应税收入
  • 小规模纳税人企业所得税优惠政策最新2023
  • linux禁用root用户
  • 分配水电费包括税费吗
  • 申报高新企业的当年一定要研发费用加计扣除吗
  • 社保公积金的钱可以提出来吗
  • uniapp全局对象
  • 获取当前位置被拒怎么办
  • PHP:pg_fetch_all()的用法_PostgreSQL函数
  • php7.0
  • 鸟瞰高耸入云的成语
  • codeigniter3中文手册
  • 约书亚树国家公园
  • php获取表单数据保存到mysql中
  • thinkphp5框架介绍
  • 发票明细清单怎么打印
  • 进项税和销项税月末怎么结转
  • 打印银行电子回单在打印机上怎么设置A5
  • springboot升级到2.1.6需要注意
  • vue导航方式
  • mysql查询性能优化
  • 零申报社保是否可以报销
  • 公司没有车加油费怎么报
  • 运输费用会计
  • db2常用操作语句
  • 履约保证金打到个人账户合法吗
  • 农业发展公司有没有库存商品的
  • 怎么计算城市
  • 新老税法
  • 商贸公司经营范围可以写烟酒吗
  • 购买农产品普通发票怎么做账
  • 外账需要计提存利息吗
  • 新成立的教育机构值得去吗
  • 房屋租赁违约金怎么规定
  • 托盘费用怎么核算
  • 本年利润借方余额需要结转吗
  • 工程发票可以抵扣增值税吗
  • mysql里面的数据类型
  • win8经常弹出转到电脑设置
  • windows server 2016最大内存
  • macbookair如何隐藏文件
  • 电脑出现系统状态
  • linux磁盘格式化后一定会清空数据吗
  • 4G内存时linux的mtrr表不正确的解决
  • win10rs2是哪个版本
  • windows102021年更新
  • xp系统的文件要用什么才能打开
  • centos配ip的方法
  • win8系统如何关机
  • win10系统组策略怎么打开
  • win10如何创建系统分区
  • windows向microsoft报告
  • 索尼笔记本安装软件顺序
  • nodejs获取客户端ip地址
  • TypeScript Type Innference(类型判断)
  • shell脚本实现文件重命名
  • javascript数组有哪些方法
  • 开的发票怎么抽奖
  • 贵州税务大厅咨询电话
  • 河北新农合怎么查询
  • 江苏徐州如何开无犯罪记录证明
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设