位置: IT常识 - 正文

三分钟认知Softmax和Sigmoid的详细区别(softag)

编辑:rootadmin
三分钟认知Softmax和Sigmoid的详细区别 目录前言1. Softmax2. Sigmoid3. 总结前言

推荐整理分享三分钟认知Softmax和Sigmoid的详细区别(softag),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:soft learning,softens,softism,soft-mindedness,soft learning,soft learning,softag,softni,内容如对您有帮助,希望把文章链接给更多的朋友!

Softmax以及Sigmoid这两者都是神经网络中的激活函数,对应还有其他的激活函数

引入激活函数是为了将其输入非线性化,使得神经网络可以逼近任何非线性函数 (原本没有引入激活函数,就是多个矩阵进行相乘,无论神经网络多少层都是线性组合,这个概念是感知机)

Softmax以及Sigmoid两者都是作为神经网络的最后一层,通过激活函数之后转换为概率值

1. Softmax

作为二分类问题探讨,是二分类的拓展版,将其拓展为N分类,对应以概率的形式展示(概率最大的类别为此类别)

全连接层的输出使用Softmax,将其输出的结果表示为概率类别(所有概率加起来为1)。

Softmax将其泛化为多分类(SVM得出的是每个类别的分数),Softmax得出的是归一化类别概率(将其所有的输出结果都归一到0和1范围内)。 对应Softmax输入N个值,输出的结果为这N个值的概率(符合概率分布),预测出的所有值加起来为1,对应哪个值比较大,则判定为该类别

其公式具体如下:(使用ex,是为了将其预测结果转换为正数,保证概率不为负数)

通过其公式可看出其特性为:

零点不可微负输入梯度为0

例子如下:

A = 1,B = 2,C = 3 对应的概率值分别为: P(A)= e1 / (e1 + e2 + e3) P(B)= e2 / (e1 + e2 + e3) P(C)= e3 / (e1 + e2 + e3)

对应代码模块如下:

import numpy as npscores = np.array([1, 2, 3])softmax = np.exp(scores) / np.sum(np.exp(scores))print(softmax)

截图如下:

三分钟认知Softmax和Sigmoid的详细区别(softag)

三者的概率值加起来为1,而且P(C)的概率值要远远大于P(A)以及 P(B)

对此Softmax的特性:

归一化并且对应的所有概率值加起来为1对应的真实类别概率值特别大,有放大(但是数值过大可能会有溢出的风险)算出的概率值为非负数

一般在使用Softmax函数作为激活函数的时候,避免溢出,通常会做特殊的处理,将其ex都替换成e-x,防止数值过大产生溢出

在TensorFlow中一般使用统一的接口:

tf.keras.losses.categorical_crossentropy(y_true, y_pred, from_logits = False)

通过from_logits参数设置,该参数为布尔变量

False,网络预测值y_pred经过Softmax输出值True,网络预测值y_pred未经过Softmax输出值

测试代码如下:

import tensorflow as tf# 3个样本,10个类别x = tf.random.normal([3,10])# 3个样本标签值y = tf.constant([9,99,999]) # 采用one_hot编码模式y_true = tf.one_hot(y, depth = 10) loss = tf.keras.losses.categorical_crossentropy(y_true, x, from_logits = False)loss = tf.reduce_mean(loss)print(loss)

截图如下:(如下使用的是False,表示经过激活函数。如果为True,输出的值也是一样的,只不过异常值的时候,False参数,Softmax会有所优化)

2. Sigmoid

逻辑回归二分类将其输入映射到【0,1】的概率分布中,Sigmoid也有这样的功能

数学公式如下:

单调递增且其反函数也有递增的性质,此函数也经常被用作神经网络的阈值函数中

用此函数预测类别,对应其值加起来并不为1,而Softmax函数加起来为1

其图像如下:

用在神经网络中,其特点如下:

梯度平滑,避免梯度跳跃连续函数,可导可微

但是缺点如下:

横向坐标轴正负无穷的时候,两侧导数为0,造成梯度消失输出非0时,均值收敛速度慢(容易对梯度造成影响)e的幂次运算比较复杂,训练时间比较长3. 总结

这两种激活函数如何选择,以及如何应用在不同场景,本身就是伯努利分布和二项分布的差别

Softmax是为了判定该类别是什么(激活函数Softmax可使用的情况下,Sigmoid也可用)

N分类互斥,且只能选择其一,选择SoftmaxN分类互斥,可选多个类别,选择Sigmoid
本文链接地址:https://www.jiuchutong.com/zhishi/292296.html 转载请保留说明!

上一篇:Drömling湿地中的灰鹤,德国 (© Mike Friedrichs/Getty Images)

下一篇:一年一度的施瓦本哈尔圣诞市集,德国巴登-符腾堡州 (© sack/Getty Images Plus)

  • 捐赠免税会计分录
  • 企业申报个税软件怎么下载
  • 税率如何计算公式
  • 长期股权投资的账面价值怎么计算
  • 农民专业合作社属于什么企业类型
  • 商贸企业购进商品怎么做成本
  • 雇佣退休人员工伤赔偿标准
  • 房地产开发企业会计科目
  • 旅游开发公司有什么职位
  • 房产税从租计征的税率是12%还是4%
  • 低值易耗品摊销什么意思
  • 委托加工的材料计入什么科目
  • 非货币交易例子
  • 安装过程中材料和工资
  • 私人转公账可以开发票吗
  • 超过离线开票限定时长09d11f怎么解决
  • 年终奖需要计入工资交社保吗
  • 异地预缴企业所得税会计分录
  • 财务每月需要报哪些税
  • 出售子公司全部股权的股权账务处理
  • 企业转让土地使用权交什么税
  • 关联方利息支出
  • 纳税人月销售额怎么算
  • 与收益相关的政府补助的确认
  • 结转基本生产成本
  • windows10无法连接到打印机,拒绝访问
  • 收到挂靠方应缴纳税款如何做账?
  • 真实有效的18岁身份证
  • linux 定时删除文件
  • 原材料运费可以计入制造费用吗
  • 股票公允价值减值怎么做账
  • 未注销的坏账可以转出吗
  • 应交增值税专栏下的增值税项目有哪些?
  • 数字孪生demo
  • php怎么设置图片的大小
  • 小规模纳税人增值税免税政策
  • 全同态加密代码
  • 新手为什么要买二手车
  • 个人电子发票怎么查询
  • 销售方开具的红字信息表
  • 公司注册资金表格模板
  • 待处理财产损溢在资产负债表中填哪里
  • dedecms转zblog
  • 购进商品的运费怎么记账
  • 应收帐款质保金
  • 股东向公司借款超过一年不还
  • 房地产项目转让流程
  • 房屋租赁交的定金可以退吗
  • mongodb 设置用户名密码
  • 休产假的工资扣个人所得税吗
  • 应收账款属于什么会计要素
  • 小规模纳税人缴纳增值税怎么做账
  • 补计提所得税怎么做分录
  • 预付工程款会计分录
  • 公户的利息收入账务处理咋处理
  • 成本会计核算方法论文怎么写
  • 总分类账的依据
  • 如何为报表指定数据源?
  • Windows Server 2008病毒偷改账号的安全隐患
  • gnu linux编程指南
  • 简单易上手 固态硬盘SSD安装WIN7系统的3种办法
  • linux怎么清除内存
  • win7 64位纯净版系统c盘空间显示与实际占用空间不对的解决方法图文教程
  • win8应用商店无法使用
  • layui框架中修改用户成功后怎么跳转到登录界面
  • node.js实战
  • perl文件操作
  • jquery 案例
  • .material design
  • 批处理检查输入文本是否为字母或数字
  • javascript核心技术
  • 轮播怎么实现
  • javascript可以做动态网页吗
  • bootstrap要学到什么程度
  • bootstrap的组件
  • 四川省税务局发票查询
  • 软件销售增值税优惠
  • 绵阳市十大纳税企业排名
  • 契税5年什么意思?
  • 国家税务总局在哪
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设