位置: IT常识 - 正文

bert-bilstm-crf提升NER模型效果的方法(bert数据增强)

编辑:rootadmin
bert-bilstm-crf提升NER模型效果的方法 1.统一训练监控指标和评估指标

推荐整理分享bert-bilstm-crf提升NER模型效果的方法(bert数据增强),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:bert调优,bert+crf,bert crf,bert 增量训练,bert+bilstm+crf,bert+lstm+crf,bert+crf,bert+crf,内容如对您有帮助,希望把文章链接给更多的朋友!

评估一个模型的最佳指标是在实体级别计算它的F1值,而不是token级别计算它的的准确率。自定义一个f1值的训练监控指标传给回调函数

Preliminary

TP:实际为P,预测为P

TN:实际为N,预测为N

FP:实际为N,预测为P

FN:实际为P,预测为N

如何记忆:

TP/TN: 以T开头,表明预测正确,预测即为第二个字母

FP/FN: 以F开头,表明预测错误,预测与第二个字母相反

Accuracy

最简单也是最好理解的,也是我们很早就开始接触的一个指标就是准确率,即预测正确的样本除以总样本数

Recall, Precision, F1

Recall(召回率):预测正确的正类在正类样本中的比例(针对于样本真实情况)

Precision(精确率):预测正确的正类在预测为正类中的比例(针对于预测情况)

F1:两者通常难以兼得,因此引入两者的调和平均,来得到一个trade-off的值

2、学习率衰减策略

学习率是深度学习中的一个重要的超参,如何调整学习率是训练出好模型的关键要素之一。

在训练过程中,一般根据训练轮数设置动态变化的学习率。

刚开始训练时:学习率以 0.01 ~ 0.001 为宜。

一定轮数过后:逐渐减缓。

接近训练结束:学习速率的衰减应该在 100 倍以上。

两种学习率衰减模式,一种为线性衰减,一种为指数衰减。

如果学习率过小,梯度下降很慢,如果学习率过大,如 Andrew Ng 的 Stanford 公开课程所说梯度下降的步子过大可能会跨过最优值。不同的学习率对 loss 的影响如下图所示:

3、分层设置学习率,非bert层要大

在使用bert或者其它预训练模型进行微调,下接其它具体任务相关的模块时,会面临这样一个问题,bert由于已经进行了预训练,参数已经达到了一个较好的水平,如果要保持其不会降低,学习率就不能太大,而下接结构是从零开始训练,用小的学习率训练不仅学习慢,而且也很难与BERT本体训练同步。因此在训练时候就需要对预训练层设置较小学习率,对下接层设置较大学习率。

4、使用对抗训练提升模型鲁棒性

对抗训练是一种能有效提高模型鲁棒性和泛化能力的训练手段,其基本原理是通过在原始输入上增加对抗扰动(噪声),得到对抗样本,再利用对抗样本进行训练,从而提高模型的表现。

5、更精细化的调参

调整learning_rate or batch_size or lamb等等

实验数据记录

#

模型

超参数

实验结果

备注

1

bilstm+crf

lstm_units = 64

epochs =80

batch_size = 32

drop_rate = 0.2

f1=0.6075

2

bilstm+crf

lstm_units = 128

epochs = 80

batch_size = 32

drop_rate = 0.2

f1=0.6011

3

bert+bilstm+crf

epochs = 8

max_len = 80

batch_size = 32

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.6697

4

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

bert-bilstm-crf提升NER模型效果的方法(bert数据增强)

leraning_rate = 1e-5

f1=0.7262

5

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.6745

统一训练监控指标和评估指标

增加学习率衰减策略

6

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.7159

分层次设置学习率

lr_multiplier=500

7

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.6889

分层次设置学习率

lr_multiplier=500

增加对抗训练(噪声)

8

bert+bilstm+crf

epochs = 32

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.6828

统一训练监控指标和评估指标

增加学习率衰减策略

分层次设置学习率

lr_multiplier=500

增加对抗训练(噪声)

5

bert+bilstm+crf

epochs = 16

max_len = 150

batch_size = 16

lstm_units = 128

drop_rate = 0.1

leraning_rate = 1e-5

f1=0.7201

统一训练监控指标和评估指标

5

本文链接地址:https://www.jiuchutong.com/zhishi/300671.html 转载请保留说明!

上一篇:ES6笔记————let,箭头函数,剩余参数(es6从入门到实战)

下一篇:【C语言进阶】文本与二进制操作文件,优化通讯录。(c语音进阶)

  • 投资性房地产采用成本模式计量
  • 化妆品销售公司简介
  • 纳税会计的要素有
  • 会计上已资本化处理的工资企业所得税前应如何扣除?
  • 如何查询企业税务状态
  • 一般纳税人认定书
  • 建筑业预缴企业所得税
  • 报个税的工资表
  • 开发支出在资产负债表是怎
  • 间接费包含哪些具体内容
  • 收到税务局附加税退税税款的分录
  • 金税盘开完票后怎么报税一下
  • 属于会计核算方法的
  • 年报中纳税总额怎么填
  • 企业对外借款是怎么规定的
  • 建筑企业小规模纳税标准
  • 工程款增值税专用发票如何开具
  • 接收境外汇款是什么意思
  • 代收水电费如何开票商品分类编码
  • 企业房产税如何计算缴纳
  • 增资印花税增加哪个税目
  • 同一个行政区
  • 填报企业年报
  • 增值税完税凭证怎么做账
  • 小规模纳税人代理销售税率是多少
  • 销售商品分期收款,减免一部分货款怎么做账
  • 收到投资方投入原材料
  • 电脑连上WiFi上不了网怎么办?
  • geeklink 极联科技
  • vue3+ts写法
  • php常用的魔术方法有哪些
  • 房地产企业利润
  • 以公允价值计量的金融资产不计提损失准备
  • 【深度学习】目标检测的性能评价指标,mAP_0.5,mAP_0.5,0.95,0.05
  • linux系统操作教程
  • react_router
  • 关于预付账款的特点
  • 注解@entity
  • 委托代销受托方会计分录
  • 销售收入和销售收入净额的区别
  • 其他应收款是如何核算的
  • 公司债券属于负债吗
  • 长期应收款计提减值
  • 建筑业挂靠企业所得税如何收取?
  • 什么是库存现金限额?为什么要核定库存现金限额
  • 销售折扣与折让在财务报表哪里
  • 残疾人个人所得税扣除
  • 销售人员的提成属于什么工资
  • 小规模企业发票税率是多少
  • 住院发票能否用医保卡
  • 偷税漏税追溯年限怎么算
  • 转账支票需要知道开户行吗
  • 销售费用怎么考核
  • 11个点增值税发票是多少
  • 银行余额调节表电子版
  • 计提折旧对公司有什么好处
  • mysqlbinlog -vvv
  • sqlserver数据库恢复挂起状态
  • linux中man的用法
  • Win10系统如何利用360压缩软件解决打不开RAR压缩包的问题
  • linux系统监控软件
  • 如何用u盘安装win8操作系统
  • Win7注册表怎么恢复命令
  • js自动执行点击事件
  • cocos2dx 3.5 win7 eclipse 环境搭建及hello world
  • jquery ztree实现右键收藏功能
  • Android 使用mp4做礼物特效
  • bat脚本怎么运行
  • linux查看远程服务是否开启
  • 单页图片和文字怎么设置
  • vue用户权限解决方案
  • 详解九章算法
  • fragment detach
  • 蛋疼的生活歌曲
  • javascript的代码
  • 增值税预缴税款退税申请怎么写
  • 无偿转让股权要交税吗
  • 机打发票教程视频
  • shell ftp -n
  • 无锡第三税务分局
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设