位置: IT常识 - 正文

生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用)

编辑:rootadmin
原力计划生成式 AI 分析:大模型 + 大量数据的神奇效果 前言

推荐整理分享生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:生成.a,ai形成生成器工具怎么用,生成式方法,ai生成模型,基于ai的生成器,生成式方法,基于ai的生成器,ai生成技术,内容如对您有帮助,希望把文章链接给更多的朋友!

如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。

大模型的涌现能力 (Emergent Ability)

下图是模型性能(Loss for next token prediction)与「参数量」和「数据集大小」之间的关系,可以看出随着「参数量」和「数据集大小」不断变大,模型性能不断增强,仿佛不会遇到瓶颈。

下图展现了大模型的涌现能力,即语言模型的性能随着参数量增加并不是线性关系,而是突然跃升,即涌现。在未达到门槛之前,性能一直在随机的水平徘徊。

Calibration

在上面的实验图中,Calibration 指「模型置信度」与「真实概率」之间的关系,即满足「置信度高 -> 正确」、「置信度低 -> 可能错误」的模型,其 Calibration 指标越好。

因此 Calibration 实际上对应着「模型是否知道自己错了」这件事,如下图所示,不同参数量的模型对应不同的颜色,可以看到模型越大,其对自己是否出错的把握越大,即「模型置信度」与「真实概率」更为贴合。

Inverse Scaling Prize

一个比赛,奖金悬赏,寻找能让「模型越大,性能越差」的任务。

在这个比赛的任务中,许多之前的 “大模型” 随着参数量变大,其性能确实变差了,但当拿出更大的模型之后,其性能又好了起来,并产生了一段 U 型曲线。

这个比赛中的任务,一般都是「具体误导性的」,例如下述这个例子:

因此对于上述这种 U 型曲线,一种猜测是:这些任务里通常包含着一些误导任务,例如上述的 5 元,当模型还没有很大的时候,由于一知半解,就会接受被误导的方法,进而使其比随机效果还要差,但当其变得足够大时,就会得到真正的结果,类似于上述的计算期望值。

Switch Transformer生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用)

Switch Transformer 模型参数量为 1.6T(GPT-3 为 1750 亿,GPT-3.5 为 2000 亿),其使用了 Mixture-of-expert 的结构,即在模型推断(Inference)的时候,选取不同的 Module,进而加快推断速度。

大数据的重要性

足够大量的数据才能让模型学会「常识,即世界知识」,如下图所示,横坐标为数据量。 数据集准备过程:

过滤有害内容(google 安全搜索)去除 HTML 标签用规则去除低品质数据去除重复数据过滤出测试集(例如 GPT-3 就未过滤出测试集)

「大模型」还是「大数据」

在固定的运算资源时,应该优先「大模型」还是「大数据」?看目前的趋势,模型大小越来越大,但训练数据量并没有明显变化。

根据下图(颜色代表固定的运算资源,横坐标为参数量,参数量越大,数据量越小),可以发现「大模型」和「大数据」需要取得平衡,只增加模型大小,不增加算力,只会让训练结果变得更差。

每个 U 型曲线取一个最低点,得到下图所示的算力与参数量(Parameters)和数据量(Tokens)之间的关系。

根据上述估计图,Google 重新估计了 Gopher(参数量为 280 Billion,数据量为 300 Billion) 对应的算力下,应该采取的参数量和数据量方案,于是训练得到了 Chinchilla(参数量为 63 Billon,数据量为 1.4 Trillion)。对比之后,发现 Chinchilla 大胜 Gopher。

根据上述结果,进一步给出了具体的「参数量」与「数据量」之间的关系:

最新的 LLaMA 也采用了这种「减少参数量,扩大数据量」的方案:

KNN LM

通常来说,语言模型在做一个分类问题,即输入为「清华大」,输出为各个候选词的概率,随后选出概率最高的词即可。

如下所示,Transformer 得到 Text 的 Embedding,随后通过线性层 + softmax 转换为分类问题。 与之对比,KNN LM 在得到 Repesentation 后,不仅训练了一个分类器,还将测试 Text 的 Repesentation 与训练数据得到的 Repesentation 进行距离计算,并根据距离得到下一个词的预测概率,再与原始分类器结合起来,得到最终结果。

另外,KNN LM 可以拿任意资料与测试 Text 的 Representation 计算距离,并不局限于训练数据。因此 KNN LM 这种机制可以使模型训练时更专注于一些难度更高的问题,对于一些仅需记忆的问题则可以通过这种方式解决。

参考资料Hung-yi Lee:生成式 AI(一)Scaling Laws for Neural Language ModelsEmergent Abilities of Large Language ModelsInverse scaling can become U-shapedSwitch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient SparsityWhen Do You Need Billions of Words of Pretraining Data?Scaling Language Models: Methods, Analysis & Insights from Training GopherDeduplicating Training Data Makes Language Models BetterTraining Compute-Optimal Large Language ModelsScaling Instruction-Finetuned Language ModelsIntroduction of ChatGPTTraining language models to follow instructions with human feedbackLearning to summarize from human feedbackGgeneralization Through Memorization: Nearest Neighbor Language ModelsLanguage Is Not All You Need: Aligning Perception with Language Models
本文链接地址:https://www.jiuchutong.com/zhishi/299778.html 转载请保留说明!

上一篇:ChatGPT频频发疯!马斯克警告:AI将毁灭人类

下一篇:Jquery 选择兄弟节点(jquery 兄弟选择器)

  • 微信运营:朋友圈营销文案技巧(微信号朋友圈运营)

    微信运营:朋友圈营销文案技巧(微信号朋友圈运营)

  • 网站

    网站"内容"与"推广"原来是这么回事(网站内容介绍)

  • 苹果手机如何添加门禁卡NFC(苹果手机如何添加输入法)

    苹果手机如何添加门禁卡NFC(苹果手机如何添加输入法)

  • OPPO Ace2支持防抖的吗(oppoace2支持防抖吗)

    OPPO Ace2支持防抖的吗(oppoace2支持防抖吗)

  • 华为手机屏幕录制怎么弄(华为手机屏幕录制怎么没有声音)

    华为手机屏幕录制怎么弄(华为手机屏幕录制怎么没有声音)

  • 苹果7p可以升级12.4吗(苹果7p可以升级15.7.6)

    苹果7p可以升级12.4吗(苹果7p可以升级15.7.6)

  • wcble是什么手机(ww是什么手机)

    wcble是什么手机(ww是什么手机)

  • oppo手机音乐为什么搜不到歌(oppo手机音乐为什么自动播放)

    oppo手机音乐为什么搜不到歌(oppo手机音乐为什么自动播放)

  • osi和tcpip的区别和联系(osi与tcpip协议的联系和区别)

    osi和tcpip的区别和联系(osi与tcpip协议的联系和区别)

  • 耳机耳撑是干嘛的(耳撑耳机戴法图解)

    耳机耳撑是干嘛的(耳撑耳机戴法图解)

  • 蜂窝移动网络打不开(蜂窝移动网络打开不能上网)

    蜂窝移动网络打不开(蜂窝移动网络打开不能上网)

  • 58手机号码注销还能再开通吗(58手机号码注销怎么注销)

    58手机号码注销还能再开通吗(58手机号码注销怎么注销)

  • 华为应用商店搜不到微信(华为应用商店搜不到球球大作战)

    华为应用商店搜不到微信(华为应用商店搜不到球球大作战)

  • 美团的评价为什么不显示不出来(美团的评价为什么会被折叠呢)

    美团的评价为什么不显示不出来(美团的评价为什么会被折叠呢)

  • 抖音手机号和身份证要同一个人的吗(抖音手机号和身份证怎么解绑)

    抖音手机号和身份证要同一个人的吗(抖音手机号和身份证怎么解绑)

  • cpu后面h啥意思(cpu后面hx是什么意思)

    cpu后面h啥意思(cpu后面hx是什么意思)

  • ipad能扩展内存吗(ipad扩展内存怎么分辨)

    ipad能扩展内存吗(ipad扩展内存怎么分辨)

  • 怎么下载tiktok(ios怎么下载tiktok)

    怎么下载tiktok(ios怎么下载tiktok)

  • 华为荣耀7x如何插卡(华为荣耀7X如何分屏)

    华为荣耀7x如何插卡(华为荣耀7X如何分屏)

  • 快手小店打不开怎么回事(快手小店打不开怎么办)

    快手小店打不开怎么回事(快手小店打不开怎么办)

  • 怎么把微信小程序后台运行(怎么把微信小程序添加到桌面)

    怎么把微信小程序后台运行(怎么把微信小程序添加到桌面)

  • 小米9se怎么打开otg(小米9se怎么打开刷卡功能)

    小米9se怎么打开otg(小米9se怎么打开刷卡功能)

  • 电脑qq消息管理器在哪里(电脑qq消息管理器的临时会话)

    电脑qq消息管理器在哪里(电脑qq消息管理器的临时会话)

  • cad大理石填充是哪个(cad大理石填充图案样式)

    cad大理石填充是哪个(cad大理石填充图案样式)

  • findfont: Font family [‘Times New Roman‘] not found. Falling back to DejaVu Sans.

    findfont: Font family [‘Times New Roman‘] not found. Falling back to DejaVu Sans.

  • 资产损失税前扣除管理办法
  • 超市小票能否入库
  • 网上商城的主要功能以及购物流程
  • 中药和中药饮片效果一样吗
  • 党费奖励需要交个税吗
  • 房地产开发企业土地增值税清算
  • 金融企业往来收入科目属于什么科
  • 一次性发放年终奖怎么税务筹划
  • 个税专项扣除做什么用
  • 劳务公司的员工与正式员工
  • 红冲去年的收入怎么做账
  • 一个企业只有收入没有支出合理吗
  • 股票持有多久可以打新股
  • 增值税普通发票查询真伪
  • 小微企业分公司 企业所得税优惠
  • 出口退税代理费用大概多少
  • 银行异地汇款抽奖需要扣缴个人所得税吗?
  • 伙食费没有发票可以税前扣除吗
  • 因税负低补缴上年度增值税分录怎么写?
  • 冲销坏账怎么做分录
  • 备用金转账个人能转吗
  • 企业签订的借款合同印花税
  • 企业类型主要有
  • word表格跨页设置
  • 分享php源码批量运行
  • xwizard.exe是什么
  • 工业企业出售边角余料交的增值税税率是多少
  • 财政补助收入的支付制度包括
  • php add
  • php写一个简单的单例模式
  • thinkphp3.1
  • 购车的车辆购置税怎么交
  • 行政单位捐赠会计分录怎么做的
  • css获取id
  • 变化检测是应用在图像的哪个运算中
  • php与其他语言的比较
  • 三代手续费返还计入什么科目
  • Joe是一款优雅功能强大的Typecho主题功能多上手快
  • 回购证券标的
  • 免收印花税
  • 其他综合收益要结转到本年利润吗
  • 工资计提和发放能不能在一个月
  • 百度ai修复照片
  • vue3子组件如何拿到父组件实例
  • 帝国cms批量添加文章
  • 期间费用指哪些费用
  • 纳税信用等级区别在哪
  • mysql更新语句
  • 残疾人开公司要交税吗
  • 航空电子客票行程单是发票吗
  • 年底计提坏账收回一部分怎么处理
  • 出口退税是什么
  • 含税销售收入会计分录
  • 一般纳税人怎么算税
  • 产品质量问题扣款账务处理
  • 员工报销签字流程
  • 自制产品无偿赠送合法吗
  • 公司库存商品科目余额太大怎么办
  • 包装物属于周转材料还是低值易耗品
  • 营利性养老院都交哪些税
  • 应收账款坏账准备借贷方向
  • 融资手续费计入长期待摊
  • 哪些企业执行新的租赁政策
  • 连接mysql数据出错1045
  • 通过修改注册表来修改chrome配置
  • SWNETSUP.EXE - SWNETSUP是什么进程 有什么用
  • 进程管理器命令
  • mac电脑卡死按哪三个键
  • win7系统关闭自动休眠
  • uefi bios ufilify
  • A Type-Safe Event System for Unity3D
  • js中鼠标经过事件
  • jqgrid单元格点击事件
  • bat批处理的if里面双感叹号
  • 编写shell脚本,实现备份文件:每天18:00归档
  • javascript教程代码
  • jquery 触发点击
  • 年度营业账簿印章怎么写
  • 国家税务局查询发票
  • 以出让方式取得的土地
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设