位置: IT常识 - 正文

BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么)

编辑:rootadmin
BERT模型基本理念、工作原理、配置讲解(图文解释) 一、BERT的基本理念

推荐整理分享BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bert模型的缺点,bert模型结构详解,bert模型怎么读,bert模型的缺点,bert模型结构详解,bert模型全称,bert模型的缺点,bert模型原理,内容如对您有帮助,希望把文章链接给更多的朋友!

BERT是Birdirectional Encoder Representation from Transformers的缩写,意为多Transformer的双向编码器表示法,它是由谷歌发布的先进的嵌入模型,BERT是自然语言处理领域的一个重大突破,它在许多自然语言处理任务中取得了突出的成果,比如问答任务,文本生成,句子分类等等,BERT成功的一个主要原因是,它是基于上下文的嵌入模型,这是它与其他流行的嵌入模型的最大不同,首先让我么了解有上下文的嵌入模型和无上下文的嵌入模型之间的区别,如以下两个句子

A:he got bit by python(他被蟒蛇咬了)

B:python is my favorite programming lauguage(python是我最喜爱的编程语言)

如果使用上下文无关的的嵌入模型进行计算单词python的嵌入值,则两个句子中python嵌入值相同,因为它会忽略语境

BERT是一个基于上下文的模型,它先理解预警,然后根据上下文生成该词的嵌入值,对于上面两个句子它将生成python不同的嵌入值,BERT将该句中的每个单词与句子中的所有单词相关联,以了解每个单词的上下文含义

 

由此可见,与上下文无关的模型生成的静态嵌入不同,BERT能够根据语境生成动态嵌入

二、BERT的工作原理

 顾名思义,BERT是基于Transformer的,我们可以把它看成只有编码器的Transformer

Transformer的编码器是双向的,它可以从两个方向读取一个句子,因此BERT由Transformer获得双向编码器特征,通过BERT模型,对于一个给定的句子,我们可以获得每个单词的上下文特征

三、BERT的配置

BERT的研究人员在发布该模型是提出了两种标准配置

BERT-base

BERT模型基本理念、工作原理、配置讲解(图文解释)(bert模型能做什么)

BERT-large

1:BERT-base 

它由十二层编码器叠加而成,每层编码器都使用十二个注意力头,其中前馈网络层由768个隐藏神经元组成,所以它得到的特征向量的大小为768

我们使用符号来表示上述内容

编码器的层数用L表示

注意力头的数量用A表示

隐藏神经元的数量用H表示

它的网络参数总数可达1.1亿个

2:BERT-large

该模型由二十四层编码器叠加而成,每层编码器都使用十六个注意力头,其中前馈网络层包含1024个隐藏神经元,所以得到的特征向量大小为1024

它的网络参数可达3.4亿个

3:BERT的其他配置

除了上述两种标准配置外,BERT还有多种不同的配置,下面列举一些小型配置

BERT-tiny L=2 H=128

BERT-mini L=4 H=256

BERT-small L=4 H=512

BERT-medium L=8 H=512

在计算资源有限的情况下,我们可以使用较小的BERT配置,但是标准的BERT配置可以得到更准确的结果并且应用更为广泛

创作不易 觉得有帮助请点赞关注收藏~~~ 

本文链接地址:https://www.jiuchutong.com/zhishi/298791.html 转载请保留说明!

上一篇:微信小程序实现滑动/点击切换Tab(微信小程序实现文件上传)

下一篇:前端中的BFC是什么?(前端bs是什么)

  • 附加税的内容有哪些
  • 小规模纳税人收入是含税还是不含税
  • 业务招待费如何进行纳税筹划
  • 施工劳务企业要交增值税吗
  • 小规模纳税人所得税费用怎么算
  • 财务费用为什么借方红字
  • 稳岗补贴给谁
  • 从事演出业务取得的收入
  • 货到票未到怎么入账
  • 学校收到政府拨付的助学金和奖学金需要缴纳税款吗
  • 员工就诊发票可以报销吗
  • 留抵进项税抵欠税后期末未交增值税会减少吗
  • 会员充值赠送
  • 完全发生在境外的服务增值税
  • 拓展培训费如何开票
  • 一般户可以收货款么
  • 税控盘抵减税款怎么转出会计分录
  • 增值税要转到营业税金及附加吗
  • 店铺拆除费用
  • 融资融券主要是哪些对象
  • 版权许可授权书
  • 报销通行费会计分录
  • 企业购进房产会退税吗
  • 盘盈的资产
  • 企业之间的往来款现金流
  • win7系统我的电脑图标不见了
  • 高新技术企业所得税优惠政策最新2022
  • 铡什么意思
  • 查看电脑系统版本
  • 新买的苹果电脑需要注意什么
  • windows7旗舰版好用吗?
  • macos big sur使用
  • 进程cmd.exe
  • 印花税怎么交款
  • autorun.exe无法运行
  • 土地受让方交的税是什么
  • loadprofiles什么意思
  • vue.js mvvm
  • php年月日时间代码
  • 房地产开发企业会计制度
  • 一般纳税人商业税负多少
  • php判断字符串是否存在
  • php怎么设置管理员权限
  • 车子的保险费
  • 发票中的密码区是如何形成的
  • 劳务所得和经营所得有啥区别
  • 境外服务费代扣代缴所得税计算
  • consul框架
  • python中文分词代码
  • 出口退税率和进项税额
  • Spring(十五):Spring整合MyBatis的两种方式
  • 一年的房租费摊销的账务处理
  • 已经认证尚未抵扣的发票
  • 可供出售金融资产属于什么科目
  • 公司销售红酒需要什么资质
  • 以银行存款支付固定资产修理费
  • 法定盈余公积一般按照企业
  • 销售出库单需要盖章吗
  • 注册资本金印花税税率是2.5还是5
  • Python3.6-MySql中插入文件路径,丢失反斜杠的解决方法
  • mysql sql 基础教程
  • xp系统 win7
  • Ubuntu 32/64位安装音乐标签编辑器Kid3的方法
  • win10系统自带的浏览器叫什么
  • 苹果Mac系统怎么用光盘安装
  • GhostXP装机版v3.0
  • explorer.exe进程文件
  • windows7桌面背景怎么设置
  • linux内核配置文件
  • win7怎么在桌面添加时钟
  • JavaScript中的数据类型分为两大类
  • 如何旋转图片30度
  • 压缩的linux命令
  • 基于贪心算法
  • 一篇文章让你彻底读懂德国历史
  • js简单代码
  • nodejs 写文件
  • 编写javascript代码
  • 社保所属期起和所属期止是什么意思区别
  • 辽宁省国家税务总局
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设