位置: IT常识 - 正文

BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么)

编辑:rootadmin
BERT模型基本理念、工作原理、配置讲解(图文解释) 一、BERT的基本理念

推荐整理分享BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bert模型的缺点,bert模型结构详解,bert模型怎么读,bert模型的缺点,bert模型结构详解,bert模型全称,bert模型的缺点,bert模型原理,内容如对您有帮助,希望把文章链接给更多的朋友!

BERT是Birdirectional Encoder Representation from Transformers的缩写,意为多Transformer的双向编码器表示法,它是由谷歌发布的先进的嵌入模型,BERT是自然语言处理领域的一个重大突破,它在许多自然语言处理任务中取得了突出的成果,比如问答任务,文本生成,句子分类等等,BERT成功的一个主要原因是,它是基于上下文的嵌入模型,这是它与其他流行的嵌入模型的最大不同,首先让我么了解有上下文的嵌入模型和无上下文的嵌入模型之间的区别,如以下两个句子

A:he got bit by python(他被蟒蛇咬了)

B:python is my favorite programming lauguage(python是我最喜爱的编程语言)

如果使用上下文无关的的嵌入模型进行计算单词python的嵌入值,则两个句子中python嵌入值相同,因为它会忽略语境

BERT是一个基于上下文的模型,它先理解预警,然后根据上下文生成该词的嵌入值,对于上面两个句子它将生成python不同的嵌入值,BERT将该句中的每个单词与句子中的所有单词相关联,以了解每个单词的上下文含义

 

由此可见,与上下文无关的模型生成的静态嵌入不同,BERT能够根据语境生成动态嵌入

二、BERT的工作原理

 顾名思义,BERT是基于Transformer的,我们可以把它看成只有编码器的Transformer

Transformer的编码器是双向的,它可以从两个方向读取一个句子,因此BERT由Transformer获得双向编码器特征,通过BERT模型,对于一个给定的句子,我们可以获得每个单词的上下文特征

三、BERT的配置

BERT的研究人员在发布该模型是提出了两种标准配置

BERT-base

BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么)

BERT-large

1:BERT-base 

它由十二层编码器叠加而成,每层编码器都使用十二个注意力头,其中前馈网络层由768个隐藏神经元组成,所以它得到的特征向量的大小为768

我们使用符号来表示上述内容

编码器的层数用L表示

注意力头的数量用A表示

隐藏神经元的数量用H表示

它的网络参数总数可达1.1亿个

2:BERT-large

该模型由二十四层编码器叠加而成,每层编码器都使用十六个注意力头,其中前馈网络层包含1024个隐藏神经元,所以得到的特征向量大小为1024

它的网络参数可达3.4亿个

3:BERT的其他配置

除了上述两种标准配置外,BERT还有多种不同的配置,下面列举一些小型配置

BERT-tiny L=2 H=128

BERT-mini L=4 H=256

BERT-small L=4 H=512

BERT-medium L=8 H=512

在计算资源有限的情况下,我们可以使用较小的BERT配置,但是标准的BERT配置可以得到更准确的结果并且应用更为广泛

创作不易 觉得有帮助请点赞关注收藏~~~ 

本文链接地址:https://www.jiuchutong.com/zhishi/298791.html 转载请保留说明!

上一篇:微信小程序实现滑动/点击切换Tab(微信小程序实现文件上传)

下一篇:前端中的BFC是什么?(前端bs是什么)

  • 青骄课堂怎么重置密码(青骄课堂怎么重新注册)

    青骄课堂怎么重置密码(青骄课堂怎么重新注册)

  • 华为p40是屏幕指纹吗(华为p40触摸屏设置)

    华为p40是屏幕指纹吗(华为p40触摸屏设置)

  • 发微信空格怎么打(微信空格键发送怎么设置)

    发微信空格怎么打(微信空格键发送怎么设置)

  • qq建小号怎么建(如何qq建小号)

    qq建小号怎么建(如何qq建小号)

  • 快手直播有回放吗(快手直播有回放吗怎么看)

    快手直播有回放吗(快手直播有回放吗怎么看)

  • airpods2正确充电方法(airpods 2如何充电)

    airpods2正确充电方法(airpods 2如何充电)

  • 手机亮度调到最高还是很暗怎么办(手机亮度调到最低黑屏了怎么办)

    手机亮度调到最高还是很暗怎么办(手机亮度调到最低黑屏了怎么办)

  • opporeno有红外线遥控功能吗(oppo reno有红外)

    opporeno有红外线遥控功能吗(oppo reno有红外)

  • 为什么ppt启动失败(ppt为什么突然打不开了)

    为什么ppt启动失败(ppt为什么突然打不开了)

  • 指令的执行是由计算机的什么来执行(指令的执行是由什么决定)

    指令的执行是由计算机的什么来执行(指令的执行是由什么决定)

  • 斗鱼id号怎么看的(斗鱼id号怎么看手机号)

    斗鱼id号怎么看的(斗鱼id号怎么看手机号)

  • 苹果11pro重量为多少g(iphone 11pro重量)

    苹果11pro重量为多少g(iphone 11pro重量)

  • 苹果11pro可以双卡吗(苹果11pro可以双开微信吗)

    苹果11pro可以双卡吗(苹果11pro可以双开微信吗)

  • 联想电脑开机按哪个键(联想电脑开机按F12没反应)

    联想电脑开机按哪个键(联想电脑开机按F12没反应)

  • 安卓root在哪里打开(安卓root权限)

    安卓root在哪里打开(安卓root权限)

  • ipad pro用什么耳机(ipadpro用什么耳机玩吃鸡)

    ipad pro用什么耳机(ipadpro用什么耳机玩吃鸡)

  • 陌陌怎么搜索用户昵称(陌陌怎么搜索用户名找人)

    陌陌怎么搜索用户昵称(陌陌怎么搜索用户名找人)

  • 苹果xr支持红外吗(苹果xr支持红外线功能吗)

    苹果xr支持红外吗(苹果xr支持红外线功能吗)

  • 天猫上门取件在哪里(天猫的上门取件要运费吗)

    天猫上门取件在哪里(天猫的上门取件要运费吗)

  • 解决TypeError: Cannot read properties of undefined (reading ‘NormalModule‘)的三种方案(解决的英文)

    解决TypeError: Cannot read properties of undefined (reading ‘NormalModule‘)的三种方案(解决的英文)

  • uni-app 怎么实现路由拦截(uni-app 怎么实现页面不跳转依旧可以传数据)

    uni-app 怎么实现路由拦截(uni-app 怎么实现页面不跳转依旧可以传数据)

  • vue查询数据el-table不更新数据(vue 查询)

    vue查询数据el-table不更新数据(vue 查询)

  • vue-plugin-hiprint vue hiprint vue使用hiprint打印控件VUE HiPrint HiPrint简单使用

    vue-plugin-hiprint vue hiprint vue使用hiprint打印控件VUE HiPrint HiPrint简单使用

  • uncompress命令  压缩或解压缩compress文件(uncompressing)

    uncompress命令 压缩或解压缩compress文件(uncompressing)

  • 应交税费是什么科目
  • 销售利税率计算公式及分析
  • 小规模纳税人减征额怎么计算
  • 高新技术认定研发费用要求
  • etc怎么取过路费啊
  • 事业单位无形资产管理制度
  • 土地增值税清算规程实施细则
  • 工程围挡做法
  • 收到银行退回的银行汇票多余款
  • 存在银行保证金计入什么会计科目
  • 委托生产企业和受托生产企业
  • 企业交残疾人基金会计分录怎么做
  • 年度中期是几月份
  • 电子账册需要缴纳印花税的规定是怎么说?
  • 开电子发票是填不含税单价吗
  • 办公车辆汽油费计入什么科目
  • 一般纳税人增值税申报操作流程
  • 购销合同印花税税率
  • 物业公司收取电费加价依据
  • 呆账催讨原则是谁提出的
  • 监事会职权口诀
  • 房租押金未全额缴纳
  • thinkphp添加数据
  • PHP:mb_decode_mimeheader()的用法_mbstring函数
  • 油费餐费入什么科目
  • NDSTray.exe - NDSTray是什么进程 有什么用
  • js的发展历史
  • 洛阿雷城堡,西班牙韦斯卡 (© Sebastian Wasek/Alamy)
  • php去除指定字符
  • 混合销售与兼营行为的区别
  • 建筑劳务 行业
  • 应纳税额等于啥
  • php 并发 解决方案
  • react 入门
  • mkdir 命令
  • 转让旧机器的会计分录
  • 江西税务官网
  • 个体工商户注册资本是多少
  • 固定资产盘盈、盘亏的账务处理?
  • 印花税应计入哪些费用
  • 长期挂账的其他应付款税务风险
  • 红字信息表必须要原件吗
  • 公司给买员工保险
  • access字符型数据
  • 教育行业税收优惠政策2022
  • 业务招待费的列支范围
  • 处置固定资产取得的净收益属于当期的收入
  • 以前年度多计提了费用
  • 老板垫付货款
  • 计提税金及附加会计分录怎么做
  • 借主营业务成本贷应付账款
  • 装修费摊销怎么计算公式
  • sql语句大全实例教程
  • xp系统怎么修改盘符
  • 复制粘贴报错
  • 联想y400装win8
  • linuxcp命令如何使用
  • iphone制造成本
  • Mac系统中pr插件汉化
  • 微软官方升级win10
  • win8怎么删除输入法
  • windows 8改windows 7
  • win8怎么把网速调到最快
  • NGUI字体图集导致Label文字破碎的BUG以及解决方案
  • ubuntu搭建ftp服务器的步骤
  • 获取文件内容
  • 深入了解求助者时,首先要进行工作是
  • python的判断
  • 从零开始学什么好
  • js禁用键盘事件
  • 很不错的两款Bootstrap Icon图标选择组件
  • java script入门
  • 基于JAVASCRIPT实现的可视化工具是
  • python中json的用法
  • 税务机关落实六保六稳
  • 工会经费税务代收现状
  • 浙江市税务局怎么进
  • 通用机油防伪查询
  • 留抵税额怎么形成的
  • 申报的销项税额怎么计算
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设