位置: IT常识 - 正文

ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样)

编辑:rootadmin
ChatGPT API接口使用+fine tune微调+prompt介绍 目录1 接口调用1.1 生成key1.2 接口功能1.2.1 图片生成 (image generation)1.2.2 对话(chat)1.2.3 中文纠错 (Chinese Spelling Correct)1.2.4 关键词提取 (keyword extract)1.2.5 抽取文本向量 (Embedding)1.2.6 微调 (fine tune)2 如何写好prompt2.1分类任务2.2 归纳总结3.3 翻译2.4 API接口多样性控制3 实用资料1 接口调用

推荐整理分享ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:api接口接入教程,api接口接入教程,chat type,t.cn api接口,ap passthrough接口,api通信接口,api接口说明,api接口说明,内容如对您有帮助,希望把文章链接给更多的朋友!

我们可以用OpenAI 提供的API接口实现很多NLP的任务,还可以支持生成图像,提取embedding以及finetune的功能。接下来我们来看下具体怎么调用接口。

1.1 生成key

首先需要从网址:https://platform.openai.com/account/api-keys,生成我们的API key: 获得key后我们就可以调用API接口了。目前OpenAI 的 API 服务提供了一个免费的 API 计算单元 (ACU) 的额度,该额度可以用于测试和试用 OpenAI 提供的服务。免费的额度用完后,需要购买额外的 ACU 才能继续使用 OpenAI 的 API 服务。我们可以从Usage和Billing:https://platform.openai.com/account/usage 里去查看我们的免费额度以及进行额度充值:

1.2 接口功能

首先我们需要安装openai

pip install openai

安装好openai以及获得API key后,我们就可以调用接口了,首先我们来看下openai能够提供的模型有什么:

import openaiopenai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"models = openai.Model.list()for model in models['data']: print(model['id'])

我们可以看出,目前提供的模型有如下: 接下来大概介绍一下我们应该怎样去调用接口,获取我们想要的结果。

1.2.1 图片生成 (image generation)import openaiimport json# 设置API密钥openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"def image_genaration(prompt): response = openai.Image.create( prompt=prompt, n=1, size="1024x1024" ) image_url = response['data'][0]['url'] return image_urlif __name__=='__main__': prompt='a delicious dessert' result = image_genaration(prompt) print(result)

prompt=‘a delicious dessert’, 其中返回url地址,我们将地址复制到浏览器中,打开看到如下图: 当prompt=‘母亲在厨房忙碌着’,OpenAI返回的效果图如下: 人物画像细节生成还不够逼真。来试一试中国的古诗词效果, prompt=‘踏花归去马蹄香’ 马蹄上应该画出一些蝴蝶🦋来表达马蹄的花香味啊,不太满意~😞

1.2.2 对话(chat)

api接口调用代码如下所示:

import openaiimport json# 设置API密钥openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"def chat(prompt): response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': prompt='人口最多的国家' result = chat(prompt) print(result)

结果如下:

1.2.3 中文纠错 (Chinese Spelling Correct)

我们可以通过合理的写prompt,基于问答形式,让gpt-3.5做NLP任务。比如对中文纠错,我们可以这样写prompt,让chagpt能够做纠错NLP任务。如下所示:

def correct(): prompt="改正错词输出正确句子:\n\n我在京东电商平台买了苹果耳几和华为体脂称" #建议prompt: 改正错词输出正确句子:\n\n input_sentence response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': result = correct() print(result)

结果如下:

1.2.4 关键词提取 (keyword extract)def keyword(): prompt="对下面内容识别2个关键词,每个词字数不超过3个字:\n\n齐选汽车挂件车内挂饰车载后视镜吊坠高档实心黄铜玉石出入平安保男女 红流苏-玉髓平安扣" #建议prompt: 对下面内容识别n个关键词,每个词字数不超过m个字:\n\n input data response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': result = keyword() print(result)

对于不同的prompt,输出的结果差异也较大。所以对于具体的任务场景,我们需要尝试不同的prompt, 根据结果的反馈,不断的调整和优化prompt,从而得到更加准确的结果。

1.2.5 抽取文本向量 (Embedding)def embedding(): content = '苹果手机' response = openai.Embedding.create( model="text-embedding-ada-002", input=content) answer = response.data[0].embedding return answerif __name__=='__main__': result = embedding() print(len(result)) print(result)

得到结果如下: 是一个1536维度的向量,我们可以基于文本的向量去做很多任务,比如计算两个向量的余弦值,计算相似性分值等。

1.2.6 微调 (fine tune)ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样)

openAI提供了接口可以用我们自己的数据进行fine tune,得到适应我们自己业务场景的新模型。假如我们需要训练一个适应我们自己领域知识的聊天机器人,我们可以按照下面流程来做fine tune。

数据准备

我们可以先把数据转成csv格式,需提供prompt列和对应的completion列,其中prompt相当于问题,completion就是对应的答案,如下是我们要用来fine tune模型的result.csv训练样本内容显示: 然后我们可以用openAI提供的数据处理工具对数据转成json格式的文件

openai tools fine_tunes.prepare_data -f result.csv

执行完后,我们会得到一个对应的json文件:result_prepared.jsonl

模型微调训练 接下来我们就可以用已有的模型 (ada, babbage, curie, davinci) 进行fine tune,官方给出的具体可以用来做微调的模型主要如下: 首先需要指定我们自己的API key:export OPENAI_API_KEY="sk-Wljk3BVhN0VieGCwAzEX*********"

然后开始训练:

openai api fine_tunes.create -t result_prepared.jsonl -m ada

在这里用我们自己的数据result_prepared.jsonl,基于base model: ada模型提交fine tune任务。提交后会返回给我们一个JOB ID,通过这个job id我们可以跟进模型在远程服务器训练情况:

openai api fine_tunes.follow -i ft-sWKDNnTmUyOGEdpvbAOvEaZt

我们可以看到结果如下: 可以看到我们的模型训练好了模型名称叫做:ada:ft-personal-2023-03-27-03-24-09,然后我们就可以试用我们训练好的模型看效果了,测试如下:

openai api completions.create -m ada:ft-personal-2023-03-27-03-24-09 -p <YOUR_PROMPT>

其中<YOUR_PROMPT>写入我们要测试的问题就好。

现在我们可以去远程服务器上查看下我们fine tune好的模型是否已经有了:

models = openai.Model.list()

发现有了刚刚fine tune的模型: 对于分类,实体识别等任务,OPNAI官网也提供了如何做处理数据,让模型做fine tune,详情可以参考官网https://platform.openai.com/docs/introduction/overview

2 如何写好prompt

prompt如何表达,对于chatgpt返回的答案会差异很大,通过prompt正确的表达问题,chatgpt才会返回更合适的结果。通过自己这些天的尝试以及官网给的提示,感受就是在写prompt时候,可以通过说明,例子,限制条件,修饰词等具体表达问题,这样chatgpt会给出更加精准的答案。接下来,我们对几种常见的任务,prompt应用如何写。

2.1分类任务

我们可以对prompt这么构造: 判断content属于A,B,C,D哪一种分类 content: detail 分类:

对应的查询结果如下:

2.2 归纳总结

提供了非常强大能力,能够基于学到的广泛知识,给出问题解决方案,合理的建议,实施步骤,商业计划,人物描写等等。所以我们可以合理写prompt,更有意思的答案。

哈哈,看起来不够大胆,于是进一步发问: 给出的这些答案果然更加激动人心。

3.3 翻译

我们可以将一种语言翻译成我们大多数其他语言。对于翻译任务,我们只需要写prompt表达我们的意愿就是: 将下面内容翻译成英语,日语,德语 content

2.4 API接口多样性控制

在调用API接口的时候,我们可以通过设置两个参数=='temperature’和’top_p’来控制生成文本的多样性和可控度==。当temperature较高时,生成的文本会更加随机和多样化,而当temperature较低时,生成的文本会更加保守和可控。top_p参数用于控制生成文本的可控度,它会限制模型生成文本时可以选择的token的数量。具体来说,当top_p越低时,模型只考虑概率分布中累计概率最高的一部分token,而忽略其他低概率的token。这样一来,生成的文本就更加可控,因为只有那些最可能的token才会被考虑。而当top_p越高的时候,生成的文本可能会更加灵活和多样,因为模型会考虑更多的低概率token。每次调用的时候,我们可以设置这两个参数:

3 实用资料

大模型训练平台:https://github.com/hpcaitech/ColossalAI 相关资料:中文精选资源清单

本文链接地址:https://www.jiuchutong.com/zhishi/296157.html 转载请保留说明!

上一篇:Element-UI侧边导航栏切换展示不同的右侧主体内容(element ui 左侧导航)

下一篇:最全ROS 入门(ros入门21讲)

  • qq群课堂学生如何连麦(qq群课堂学生如何分享屏幕)

    qq群课堂学生如何连麦(qq群课堂学生如何分享屏幕)

  • 蓝奏云手机上怎么注册(蓝奏云手机怎么解压)

    蓝奏云手机上怎么注册(蓝奏云手机怎么解压)

  • 苹果手机怎么连接到电脑(苹果手机怎么连接电脑)

    苹果手机怎么连接到电脑(苹果手机怎么连接电脑)

  • 华为mate30pro支持双卡5g吗(华为mate30pro支持wifi6吗)

    华为mate30pro支持双卡5g吗(华为mate30pro支持wifi6吗)

  • qq邮箱的漂流瓶怎么没了(qq邮箱漂流瓶取消了吗)

    qq邮箱的漂流瓶怎么没了(qq邮箱漂流瓶取消了吗)

  • 快充充电变慢怎么恢复(快充充电变慢怎么解决)

    快充充电变慢怎么恢复(快充充电变慢怎么解决)

  • 华为录视频的功能在哪(华为录视频功能手势)

    华为录视频的功能在哪(华为录视频功能手势)

  • 5g是第几代通信技术标准(5g是指第五代)

    5g是第几代通信技术标准(5g是指第五代)

  • 腾讯文档分享失败是什么原因(腾讯文档分享失败请稍后重试(2))

    腾讯文档分享失败是什么原因(腾讯文档分享失败请稍后重试(2))

  • 淘宝一个钻多少单(淘宝一个钻多少权重)

    淘宝一个钻多少单(淘宝一个钻多少权重)

  • wps艺术字怎么拉伸放大(wps艺术字拉伸字体)

    wps艺术字怎么拉伸放大(wps艺术字拉伸字体)

  • 计算机有哪三部分组成(计算机有哪三部分构成)

    计算机有哪三部分组成(计算机有哪三部分构成)

  • 电脑无桌面图标是什么原因(电脑无桌面图标怎么回事)

    电脑无桌面图标是什么原因(电脑无桌面图标怎么回事)

  • ipad支持快充吗(苹果2019款ipad支持快充吗)

    ipad支持快充吗(苹果2019款ipad支持快充吗)

  • 取消阻止来电号码后能收到之前发的短信吗(取消阻止来电号码是什么意思)

    取消阻止来电号码后能收到之前发的短信吗(取消阻止来电号码是什么意思)

  • 可以在苹果手机重新设置ID账号和密码吗(华为蓝牙耳机可以在苹果手机)

    可以在苹果手机重新设置ID账号和密码吗(华为蓝牙耳机可以在苹果手机)

  • ipv4地址是什么意思(ipv4地址是什么位的二进制数)

    ipv4地址是什么意思(ipv4地址是什么位的二进制数)

  • 为什么淘宝界面不一样(为什么淘宝界面变黑白色)

    为什么淘宝界面不一样(为什么淘宝界面变黑白色)

  • 共享实时位置怎么修改(共享实时位置怎么关闭)

    共享实时位置怎么修改(共享实时位置怎么关闭)

  • 荣耀20有nfc和红外吗(荣耀20有nfc功能在哪里)

    荣耀20有nfc和红外吗(荣耀20有nfc功能在哪里)

  • 微信会自动退出登录吗(为什么平板微信会自动退出)

    微信会自动退出登录吗(为什么平板微信会自动退出)

  • 微信怎么关闭手机号查找(微信怎么关闭手机号添加)

    微信怎么关闭手机号查找(微信怎么关闭手机号添加)

  • phone-30是什么手机(phone0是什么意思)

    phone-30是什么手机(phone0是什么意思)

  • 极米怎么调整画面大小(极米怎么调整画面比例)

    极米怎么调整画面大小(极米怎么调整画面比例)

  • yolov5——detect.py代码【注释、详解、使用教程】(yolo object detection)

    yolov5——detect.py代码【注释、详解、使用教程】(yolo object detection)

  • 无偿划转股份是好是坏
  • 所得税可以弥补几年
  • 增值税申报错误已经缴税了怎么办
  • 怎么计提固定资产折旧科目
  • 建筑工程怎么确定施工工程进度
  • 开业前所有费用叫做什么
  • 不动产融资租赁税率是多少
  • 抵扣认证发票时间
  • 开立个人银行账户的条件
  • 固定资产当月入账下月计提折旧
  • 增值税普通发票几个点
  • 机打发票多久可以作废
  • 三证合一办完后的流程
  • 地勘单位需要什么资质
  • 远洋船员如何征收个人所得税?
  • 房地产企业预收款什么时候确认收入
  • 海运增值税率
  • 软件企业怎么享受三免两减半
  • 是否有综合所得申报是什么意思
  • 企业收入代扣税金应该怎么做会计处理?
  • 离职有补偿金的可不可以领取失业金
  • 房屋拆迁过渡费由哪个部门发
  • 所得税申报怎么弥补以前年度亏损
  • 电脑开机故障不开机
  • 若依前后端分离需要准备啥
  • 其他债权投资期末公允价值的变动应当计入
  • 权益净利率如何提高
  • ajax调用php函数
  • 应收账款转让分录
  • 苹果mac os 10.4
  • win11预览版选哪个
  • 自建房买卖需要缴哪些费用
  • 质量赔偿款要交税吗
  • 纳税申报方式有直接申报邮寄申报数据电文
  • phpajax技术
  • vue3组件写法
  • 发票抬头可以是两个人吗
  • php 构造方法
  • golang调用python代码
  • 命令执行函数echo
  • 工伤保险赔付计算
  • 百度编辑器使用方法
  • 企业并购的主要特征是a扩大企业规模
  • linux mint 下mysql中文支持问题
  • mysql字符集详解
  • mysql怎么修改
  • 报销发票哪些可以抵税
  • 同控和非同控的企业合并的分录
  • 交易性金融资产公允价值变动怎么算
  • 新会计制度固定资产折旧账务处理
  • 购买的商品用于什么
  • 支付补偿款计入什么会计科目
  • 企业收到加盟费怎么开发票
  • 金税盘技术维护费
  • 社保账务如何做会计分录
  • 人工费怎么核算
  • 物流公司主营业务成本会计分录
  • 佣金开什么发票内容?
  • 结算金额和付款金额
  • 最新版日历
  • win2000蓝屏0x0000007b
  • Windows Server 2008下的网络排错
  • ubuntu系统中安装微信步骤
  • centos6.5安装yum
  • windows虚拟内存设置
  • 卸载声卡驱动有什么影响
  • ie的进程
  • pqinit.exe - pqinit是什么进程 有什么用
  • WIN10系统中断
  • 系统右键菜单
  • android打包v1v2
  • android_zh
  • css制作热点新闻板块
  • javascript深入理解
  • [置顶]津鱼.我爱你
  • 如何做好设计师
  • 怎样纳税申报和缴纳
  • 泰兴市地方税务局
  • 江西省税务局电话号码查询
  • 税控盘可以换成ukey吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设