位置: IT常识 - 正文

训练自己的GPT2-Chinese模型(训练自己的GPT)

编辑:rootadmin
训练自己的GPT2-Chinese模型 文章目录效果抢先看准备工作环境搭建创建虚拟环境训练&预测项目结构模型预测续写训练模型遇到的问题及解决办法显存不足生成的内容一样文末效果抢先看

推荐整理分享训练自己的GPT2-Chinese模型(训练自己的GPT),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:训练自己的GPT模型,训练自己的GPT模型,训练自己的gpt 问答库,训练自己的大语言模型,训练自己的GPT模型,训练自己的GPT,训练自己的gpt模型有什么用,训练自己的gpt模型有什么用,内容如对您有帮助,希望把文章链接给更多的朋友!

准备工作

从GitHub上拉去项目到本地,准备已训练好的模型百度网盘:提取码【9dvu】。

gpt2对联训练模型gpt2古诗词训练模型gpt2通用中文模型gpt2通用中文小模型gpt2文学散文训练模型gpt2中文歌词模型环境搭建配置好GPU的pytorch环境 a. 安装Anaconda环境 b. NIVIDA配置流程 桌面右键鼠标,找到NVIDIA控制面板,在左边找到开发者下管理GPU性能计数器,导航栏点击桌面选择启用开发者设置,弹出的系统信息中找到组件,找到产品名前缀为NVIDIA CUDA的那一条,记住其后面的版本号。 c. 进入NVIDIA官网下载CUDA,找到上一步记录的NVIDIA CUDA后的版本号相对应的链接。如版本信息为11.4就选择11.4 d. 下载完点击安装就行了 e. 安装cuDNN,选择相应的版本。这个地方要登录账号,没有账号可以注册,也可以选择QQ或微信登录,选择刚才的CUDA版本,下载压缩包 f. 下载完成后解压缩,并修改根目录名为cudnn g. 将整个文件复制到xxx\NVIDIA GPU Computing Toolkit\CUDA\v11.4目录下 h. 设置变量环境,添加两个环境变量路径,根据自己的实际情况目录修改

pytorch配置 a. 去pytorch官网找到相应的gpu版本或cpu版本,找到后安装命令会出现在command栏 找不到自己的版本点击previous version链接 b. 使用管理员身份执行cmd,否则会安装失败

conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

安装完成之后执行命令conda list查看是否安装成功

训练自己的GPT2-Chinese模型(训练自己的GPT)

打开终端输入python,使用以下代码查看torch显示GPU不可用状态

>>>import torch>>>torch.cuda.is_available()False

c. 标准查看torch版本

>>>import torch>>>torch.__version__1.10.2

pytorch轮子配置 a. whl轮子配置,根据CUDA版本选择相应的版本。其中cu表示GPU版本,cpu表示CPU版本 b. 下载完成之后本地使用pip install 安装

pip install .\torchvision-0.13.1+cpu-cp39-cp39-win_amd64.whlpip install .\torch-1.10.2+cu113-cp39-cp39-win_amd64.whl

c. 安装完成之后验证torch

>>>import torch>>>torch.cuda.is_available()True创建虚拟环境为了能够顺利使用环境,推荐使用python3.7.1版本conda create -n venv_name python=3.7.1激活 虚拟环境conda activate venv_namepip安装所需库pip install transformers==2.1.1pip install tensorflow==2.0.0 pip install numpypip install tqdmpip install sklearnpip install keraspip install tb-nightlypip install futurepip install thulacpip install setuptools==59.5.0pip install torch==1.10.2+cu113 torchvision==0.3.0 --extra-index-url 训练&预测项目结构config: 存放模型的配置文件data: 存放训练数据model: 存放模型cache: 用于模型训练之前的数据预处理sample: 用于存放生成样本的目录generate.py: 生成代码train.py: 训练多文本启动代码train_single.py: 训练但文本启动代码tokenizations: 用于文本数据转换tokenizations的脚本模型预测续写

参数说明:

length: 生成的最长长度prefix: 文章开头fast_pattern: 快速生成模式save_samples: 保存生成文本结果的位置temperature: 越小越遵循训练样本,续写的内容的思维越发散# 通用模型预测文本python ./generate.py --length=100 --nsamples=4 --prefix=天津是一座美丽的城市。 --fast_pattern --save_samples ----model_path=model/use_model --model_config=config/model_config_small.json --topk=8 --temperature=0.8 --batch_size=2# 制定模型输出python ./generate.py --length=300 --nsamples=4 --prefix=萧炎,斗之力。 --fast_pattern --save_samples --model_path=model/model_epoch18 --model_config=model/model_epoch18/config.json --topk=8 --temperature=1 --batch_size=1

其他参数参考:

训练模型

将训练语料以train.json的格式放入data目录中

如果文件格式为train.json格式,那么将train.py文件中的读取方式为:lines = json.load(f) 如果文件格式为train.txt格式,即数据格式为[”正文1“, ”正文2“, ”正文3“],那么将train.py文件中的读取方式为:lines = f.readlines()

运行train.py文件并设定--raw参数,会自动预处理数据,预处理完成之后,会自动执行训练。

python train.py --raw遇到的问题及解决办法显存不足语料太大:在config文件中选择小一点的json文件batch_size过大:默认训练是8,可以改成4或者6尝试生成的内容一样修改generate.py中的batch_size=1文末

此训练结果生成比较简单的文章还可以,但是需要达到理想的效果,还需要更大的数据体系和语料以及长期的模型训练,基于原有的算法二次开发,门槛也比较高,而且这种业务比较吃硬件资源。

本文链接地址:https://www.jiuchutong.com/zhishi/298719.html 转载请保留说明!

上一篇:路由懒加载及实现方式(vue-router)(路由加载的几种方式)

下一篇:2022前端面经---改变this指向问题(call、apply、bind)(2021年前端面试)

  • 错误习惯成自然(错误决定改变人的一生)

    错误习惯成自然(错误决定改变人的一生)

  • 联通流量限速了网速怎么恢复(联通流量限速了怎么提速恢复)

    联通流量限速了网速怎么恢复(联通流量限速了怎么提速恢复)

  • iphonese2有3dtouch功能吗

    iphonese2有3dtouch功能吗

  • 原彩显示突然没了(原彩显示没变化)

    原彩显示突然没了(原彩显示没变化)

  • 打印机用户干预是什么意思(打印机用户干预怎么解决)

    打印机用户干预是什么意思(打印机用户干预怎么解决)

  • 微信表情没了如何恢复(微信表情没有了怎么找回来)

    微信表情没了如何恢复(微信表情没有了怎么找回来)

  • 华为热点只能连接一台怎么办(华为热点只能连接一台)

    华为热点只能连接一台怎么办(华为热点只能连接一台)

  • 16位和32位的区别(16位和32位的区别音频)

    16位和32位的区别(16位和32位的区别音频)

  • 手机怎么才能进入pornhub啊(手机怎么才能进国外网站)

    手机怎么才能进入pornhub啊(手机怎么才能进国外网站)

  • 音响充电12小时可以吗(音响充电十多个小时怎么还是红灯呢)

    音响充电12小时可以吗(音响充电十多个小时怎么还是红灯呢)

  • 华为p40下巴多少毫米(华为p40下巴宽度)

    华为p40下巴多少毫米(华为p40下巴宽度)

  • 什么软件可以美化视频(什么软件可以美白牙齿)

    什么软件可以美化视频(什么软件可以美白牙齿)

  • 打开双4g有什么好处(手机开启双4g网络有什么好处)

    打开双4g有什么好处(手机开启双4g网络有什么好处)

  • 抖音怎么上传5分钟长视频(抖音怎么上传5分钟视频教程)

    抖音怎么上传5分钟长视频(抖音怎么上传5分钟视频教程)

  • 怎么给优活手环充电(优活手环怎么配对)

    怎么给优活手环充电(优活手环怎么配对)

  • 苹果手机怎么运行诊断(苹果手机怎么运镜)

    苹果手机怎么运行诊断(苹果手机怎么运镜)

  • iqooneo是否支持nfc(vivoiqooneo支持nfc吗)

    iqooneo是否支持nfc(vivoiqooneo支持nfc吗)

  • 云闪付可以扫微信吗(云闪付)

    云闪付可以扫微信吗(云闪付)

  • win10蓝屏终止代码irql(win10蓝屏终止代码critical process)

    win10蓝屏终止代码irql(win10蓝屏终止代码critical process)

  • 华为运动手表怎么调时间(华为运动手表怎么连接蓝牙)

    华为运动手表怎么调时间(华为运动手表怎么连接蓝牙)

  • 微信互删功能在哪里(微信互删在哪里找到)

    微信互删功能在哪里(微信互删在哪里找到)

  • 华为手机屏幕旋转关闭教程(华为手机屏幕旋转设置)

    华为手机屏幕旋转关闭教程(华为手机屏幕旋转设置)

  • 如何解决Win10蓝屏提示错误memory management?(win10蓝屏怎么弄)

    如何解决Win10蓝屏提示错误memory management?(win10蓝屏怎么弄)

  • Win11正式版发现新问题:不兼容注册表中带有非 ASCII 字符的应用程序(window10发现威胁怎么办)

    Win11正式版发现新问题:不兼容注册表中带有非 ASCII 字符的应用程序(window10发现威胁怎么办)

  • vue项目遇见事件冒泡如何处理(vue事件bus)

    vue项目遇见事件冒泡如何处理(vue事件bus)

  • 织梦后台直接添加会员功能开发方法(织梦怎么建站)

    织梦后台直接添加会员功能开发方法(织梦怎么建站)

  • 农资公司性质
  • 所得税税负率的计算公式中营业收入含不含税
  • 积分兑换商品怎么入账
  • 企业所得税季度申报表A类
  • 分公司缴税企业所得税
  • 超市卡发票可以抵扣吗
  • 车间职工报销医药费能使用现金吗
  • 增值税转型的主要内容
  • 销售免税产品怎么做分录
  • 应取得未取得发票
  • 营业外收入在资产负债表怎么填
  • 存货报废应如何记账
  • 已经认证的进项税转出
  • 个人借公司款利率多少合法
  • 多交印花税申请怎么写
  • 预付款怎么做账务处理
  • 企业接收政府划入资产的税务处理办法
  • 最新个人独资企业
  • 非居民纳税人怎么纳税
  • 滞纳金是否有上限
  • 集团公司奖励发放遵循什么原则
  • 收到承兑后背书怎么处理
  • 固定资产折旧可以不留残值吗
  • 增值税查补税款可以开发票吗
  • 小规模销项负数发票怎么做账
  • 小规模纳税人金融服务税率
  • 认证成功次月何时补发
  • 外资股东是什么意思
  • proflwiz.exe - proflwiz是什么进程 有什么用
  • 路由器管家怎么登录
  • 银行手续费发票税率
  • PHP:pg_field_type()的用法_PostgreSQL函数
  • 如何增加税务稽查信息
  • 房地产企业预缴税款最新规定
  • 贴现带息与不带息公式
  • php制作微信小程序
  • php trait用法
  • 简单的css特效
  • 小程序设计制作
  • spring三级缓存有什么用
  • php sleep函数
  • python中函数的用法
  • 未开票金额怎么报税
  • 现金流量表和资产负债表的区别
  • 金税盘证书已冻结怎么解决
  • 推广服务费可以抵扣吗
  • 毛利的计算公式为
  • 一般纳税人简易征收最新政策
  • 进项税额是什么意思
  • sqlserver 2008数据库事务日志已满怎么处理
  • 员工意外伤害保险最多赔多少
  • 增值税小规模纳税人2023年政策
  • 应付账款预付账款应收账款预收账款
  • 计提的生产车间职工工资
  • 补发工资如何计算个税
  • 本月没有认证的发票怎么做账
  • 固定资产的改良支出有哪些
  • 研发费加计扣除申报表怎么填
  • 进口增值税当月可以抵扣吗
  • 物流公司怎么做利润高
  • 一个完整的活动策划方案范文
  • mysql m1
  • win 7操作系统安装
  • 无法安装osx
  • mac新版系统
  • 华硕和联想笔记本电脑哪个好点
  • win8怎么调出任务栏
  • Windows7电脑怎么调整屏幕亮度
  • jquery实现分页功能
  • 最基本的实现进程是
  • JavaScript焦点事件、鼠标事件和滚轮事件使用详解
  • jQuery使用Selectator插件实现多选下拉列表过滤框(附源码下载)
  • 记住密码自动登录怎么取消
  • 国家税务江苏税务总局官网
  • 辽宁省耕地占用税税率
  • 资产管理公司收购不良资产后怎么处置
  • 物业收取水电费的通知范文
  • 超豪华小汽车需要在什么环节纳税
  • 个人所得税完税证明图片
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设