位置: IT常识 - 正文

ChatGPT研究分析:GPT-4做了什么(patriotic研究)

编辑:rootadmin
ChatGPT研究分析:GPT-4做了什么

推荐整理分享ChatGPT研究分析:GPT-4做了什么(patriotic研究),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:ptst分析法,ptst分析法,srtp研究报告,ptst分析法,ptst分析法,srtp研究报告,chartted研究,chartted研究,内容如对您有帮助,希望把文章链接给更多的朋友!

前脚刚研究了一轮GPT3.5,OpenAI很快就升级了GPT-4,整体表现有进一步提升。追赶一下潮流,研究研究GPT-4干了啥。

本文内容全部源于对OpenAI公开的技术报告的解读,通篇以PR效果为主,实际内容不多。主要强调的工作,是“Predictable Scaling”这个概念。

ChatGPT研究分析:GPT-4做了什么(patriotic研究)

上一版ChatGPT的主要挑战是,因为模型的训练量极大,很难去进行优化(ChatGPT是fine-tuning的模式)。因此,OpenAI希望能够在模型训练初期,就进行优化,从而大幅提升人工调优迭代的效率。而想要进行调优,就得知道当前模型的效果如何。因此,这个问题就被转化为了:如何在模型训练初期,就能够预测最终训练完成后的实际效果。

从结果来看,ChatGPT实现了,仅仅执行千分之一到万分之一的训练量,就可以大致预测模型的结果。

实现原理相对简单,就是在某一个模型的不同训练阶段进行实际效果测量,然后做函数拟合,发现符合幂等曲线。然后再基于采样值,测算一下幂等函数的相关参数,下一轮就可以只进行少量训练,就去预测最终效果了。

至于其他效果上的优化,OpenAI没有进一步解读原理,但整体应该还是基于“训练-奖励”的优化模型,去生成更针对性的奖励模型(比如增加法律、安全之类的奖励判断),以实现更优的效果。

原版内容如下:

3 Predictable ScalingA large focus of the GPT-4 project was building a deep learning stack that scales predictably. The primary reason is that for very large training runs like GPT-4, it is not feasible to do extensive model-specific tuning. To address this, we developed infrastructure and optimization methods that have very predictable behavior across multiple scales. These improvements allowed us to reliably predict some aspects of the performance of GPT-4 from smaller models trained using 1, 000× – 10, 000× less compute.3.1 Loss PredictionThe final loss of properly-trained large language models is thought to be well approximated by power laws in the amount of compute used to train the model [35, 36, 2, 14, 15].To verify the scalability of our optimization infrastructure, we predicted GPT-4’s final loss on our internal codebase (not part of the training set) by fitting a scaling law with an irreducible loss term (as in Henighan et al. [15]): L(C) = aCb + c, from models trained using the same methodology but using at most 10,000x less compute than GPT-4. This prediction was made shortly after the run started, without use of any partial results. The fitted scaling law predicted GPT-4’s final loss with high accuracy (Figure 1).3.2 Scaling of Capabilities on HumanEvalHaving a sense of the capabilities of a model before training can improve decisions around alignment, safety, and deployment. In addition to predicting final loss, we developed methodology to predict more interpretable metrics of capability. One such metric is pass rate on the HumanEval dataset [37], which measures the ability to synthesize Python functions of varying complexity. We successfully predicted the pass rate on a subset of the HumanEval dataset by extrapolating from models trained with at most 1, 000× less compute (Figure 2).For an individual problem in HumanEval, performance may occasionally worsen with scale. Despite these challenges, we find an approximate power law relationship −EP [log(pass_rate(C))] = α∗C−kwhere k and α are positive constants, and P is a subset of problems in the dataset. We hypothesize that this relationship holds for all problems in this dataset. In practice, very low pass rates are difficult or impossible to estimate, so we restrict to problems P and models M such that given some large sample budget, every problem is solved at least once by every model.We registered predictions for GPT-4’s performance on HumanEval before training completed, using only information available prior to training. All but the 15 hardest HumanEval problems were split into 6 difficulty buckets based on the performance of smaller models. The results on the 3rd easiest bucket are shown in Figure 2, showing that the resulting predictions were very accurate for this subset of HumanEval problems where we can accurately estimate log(pass_rate) for several smaller models. Predictions on the other five buckets performed almost as well, the main exception being GPT-4 underperforming our predictions on the easiest bucket.Certain capabilities remain hard to predict. For example, the Inverse Scaling Prize [38] proposed several tasks for which model performance decreases as a function of scale. Similarly to a recent result by Wei et al. [39], we find that GPT-4 reverses this trend, as shown on one of the tasks called Hindsight Neglect [40] in Figure 3.We believe that accurately predicting future capabilities is important for safety. Going forward we plan to refine these methods and register performance predictions across various capabilities before large model training begins, and we hope this becomes a common goal in the field.

本文链接地址:https://www.jiuchutong.com/zhishi/298684.html 转载请保留说明!

上一篇:博客管理系统(前端页面设计)(博客管理系统开题报告)

下一篇:跟我学Python图像处理丨带你入门OpenGL(用python处理图像)

  • bilibili如何退出后还能播放视频(哔哩哔哩如何退出公会)

    bilibili如何退出后还能播放视频(哔哩哔哩如何退出公会)

  • 微信企业公众号怎么开通(微信企业公众号申请)

    微信企业公众号怎么开通(微信企业公众号申请)

  • 微博的深色模式如何设置(微博的深色模式在哪里设置)

    微博的深色模式如何设置(微博的深色模式在哪里设置)

  • ae cc是什么版本(ae cc哪个版本好用)

    ae cc是什么版本(ae cc哪个版本好用)

  • 笔记本windows键是哪个键(笔记本Windows键不可用)

    笔记本windows键是哪个键(笔记本Windows键不可用)

  • 苹果手机屏幕上的圆点叫什么(苹果手机屏幕上的小圆点怎么打开)

    苹果手机屏幕上的圆点叫什么(苹果手机屏幕上的小圆点怎么打开)

  • gtx880m什么级别显卡

    gtx880m什么级别显卡

  • 微信注销一个月别人可以搜到吗(微信注销一个月了,还能用手机号搜索到吗)

    微信注销一个月别人可以搜到吗(微信注销一个月了,还能用手机号搜索到吗)

  • 抖音粉丝灯牌怎么取消(抖音粉丝灯牌怎么亮起来)

    抖音粉丝灯牌怎么取消(抖音粉丝灯牌怎么亮起来)

  • 腾讯视频怎么设置跳过片头和片尾(腾讯视频怎么设置时间限制)

    腾讯视频怎么设置跳过片头和片尾(腾讯视频怎么设置时间限制)

  • 微信32位和64位有什么区别

    微信32位和64位有什么区别

  • 抖音怎么图片评论(抖音怎么图片评论苹果)

    抖音怎么图片评论(抖音怎么图片评论苹果)

  • word文件怎么保存到桌面(word文件怎么保存到电脑桌面)

    word文件怎么保存到桌面(word文件怎么保存到电脑桌面)

  • 流量没有限速为什么网速很慢(流量没有限速为什么)

    流量没有限速为什么网速很慢(流量没有限速为什么)

  • 3皇冠qq号多少级(皇冠等级qq号能卖多少钱)

    3皇冠qq号多少级(皇冠等级qq号能卖多少钱)

  • 华为p30p无线充电怎么开启(华为p30p无线充电电流多少)

    华为p30p无线充电怎么开启(华为p30p无线充电电流多少)

  • 文本占位符在哪里(文本占位符大小怎样设置)

    文本占位符在哪里(文本占位符大小怎样设置)

  • vivo手机的账号密码在哪里可以找到(vivo手机的账号与同步可以关掉吗)

    vivo手机的账号密码在哪里可以找到(vivo手机的账号与同步可以关掉吗)

  • 华为g750-t01是什么手机(华为g750-t01多少钱)

    华为g750-t01是什么手机(华为g750-t01多少钱)

  • 华为建立了什么管端战略(华为的建立过程)

    华为建立了什么管端战略(华为的建立过程)

  • ios13怎样快捷截屏(ios13怎么截图)

    ios13怎样快捷截屏(ios13怎么截图)

  • 2016cp6878是小米几(2016cp6878是小米什么型号)

    2016cp6878是小米几(2016cp6878是小米什么型号)

  • 芒果tv如何登录其他账号(芒果tv如何登录小米账号)

    芒果tv如何登录其他账号(芒果tv如何登录小米账号)

  • 11是双卡吗(华为nova11是双卡吗)

    11是双卡吗(华为nova11是双卡吗)

  • 无线直连是什么意思(无线直连是什么东西)

    无线直连是什么意思(无线直连是什么东西)

  • 个人销售商品交什么税
  • 开票地址太长显示不全
  • 建筑行业预缴增值税可以用进项抵缴吗
  • 机票抵税申报表咋填
  • 现金日记账支出和收入表格怎么做
  • 应付职工薪酬期初余额在哪方
  • 进项税抵扣销项税
  • 销售给客户红包,说给的现金,如何把控
  • 车船发票什么样子
  • 退休返聘人员购买什么商业保险
  • 破产企业公司还要交税吗
  • 一次还本付息债券到期收益率
  • 三证合一后还要去税务局吗
  • 股票红利税如何征收
  • 如何正确理解新制度经济学与新古典经济学的关系
  • 企业的停车违章怎么查
  • 财务费用利息收入在损益表中怎么填
  • 个税手续费返还奖励财务人员的文件
  • 公司研发产品
  • 办公软件无形资产的确认条件有哪些
  • 增值税进项转出后企业所得税调整是含税价还是不含税价
  • 投资公司如何确定收入
  • 公司购买理财产品如何做账
  • 苹果手机miracast在哪里找到
  • w11系统有哪些新功能
  • 鸿蒙系统获取电脑文件
  • 在win7系统中文件属性有哪些
  • 税收返还的账务处理
  • 天猫公司不开银行卡吗
  • 弥补亏损的会计分录是怎样的
  • 差额承兑汇票办法规定
  • 移动硬盘通过软件改硬盘容量怎么改
  • 代开专用发票缴纳增值税需要计提吗?
  • 苹果手机最贵的软件是哪个
  • 商企预提待付费什么意思
  • 一亩地是多少平方?
  • 哪些货物可以享受减免税政策
  • 资产负债表根据明细账余额填列的项目
  • 暂估入账的原材料有成本差异吗
  • thinkphp验证码刷新
  • 应收票据年末计息的分录
  • yii框架手册
  • 遗传算法排课代码python
  • js匿名函数和命名函数
  • 现代服务包括哪些税目
  • python迭代器iterator
  • 非税收入定额票据可以报销吗去什么地方报销
  • CentOS6.9下mysql 5.7.17安装配置方法图文教程
  • mysql日期和时间类型
  • mongodb连接数
  • php指定域名访问
  • 固定资产折旧计算方法公式大全
  • 企业所得税营业外收入
  • 固定资产一次性扣除账务处理
  • 申报抵扣
  • 公司配股对股价的影响
  • 土地返还金
  • 电子发票是否是原件发票
  • 实收资本是什么公司
  • mysql处理
  • mysql中自定义函数属于那个
  • mac怎么修改默认应用
  • xp系统镜像文件怎么制作
  • 教程图解
  • mac如何连接iphone
  • win10系统锁屏后不弹出解锁界面
  • 在windowsxp的应用程序中,经常有一些菜单选项呈暗灰色
  • mac配置selenium
  • win10无法
  • windows 8改windows 7
  • [置顶]电影名字《收件人不详》
  • css-1
  • 批处理 修改文件名
  • jquery点击按钮切换图片
  • python获取list集合中某一元素的值
  • 安卓自定义app
  • pythonwhile循环语句用法
  • 北京公积金缴纳最低基数
  • 除了增值税还要什么税种
  • 2018年企业所得税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设