OpenAI 开放 GPT-3.5 Turbo 自定义微调

发布日期：2023-08-23 分类：AI 阅读(48) 评论(0)

OpenAI 宣布，企业现在可以利用自己的数据对 GPT-3.5 Turbo 进行微调。通过这种方式获得的定制模型在某些任务上的表现可以匹敌甚至超越 GPT-4。值得注意的是，今年秋季稍后时候，OpenAI 还将推出更为先进的 GPT-4。

微调（Fine-tuning）让企业能够将 ChatGPT 打磨成在特定任务下的高效模型。通过监督训练，可以创造出适应特定需求的独特机器人，使其能够在特定领域提供可靠的回应，或使用更简明的表达方式。商业用户过去只能使用 GPT-3 的变体来达到这一目标，例如 davinci-002 或 babbage-002。

这些模型与 GPT-4 类似，在预训练阶段（截至 2021 年 9 月之前）进行了初始训练，然后能够使用公司的数据进行微调。值得强调的是，这些数据以及所有输入和输出都不会被用于客户组织以外的模型训练。

另外，微调还可用于训练机器人模仿品牌的「声音」，以确保一致性。例如，可以使用部分由 AI 撰写的广告文案或内部通信来实现这一点，这在许多情况下已经得到实践应用。软件公司还可以将其应用于常规代码，如 API 调用，或者用于可靠地格式化和完成代码片段。

GPT-3.5 Turbo 是 OpenAI 于 2023 年早些时候推出的模型系列，特别适合处理非特定的聊天场景。该模型一次可以处理 4000 个 token，相较以往的模型提升了一倍。在使用微调指令来引导 GPT-3.5 之后，早期测试者已经能够将提示信息缩短 90%。

微调成本分为两部分：初始训练成本和使用成本：

初始训练：$0.008 / 1K Tokens
使用输入：$0.012 / 1K Tokens
使用输出：$0.016 / 1K Tokens

例如，一个 gpt-3.5-turbo 微调作业包含 100000 个 tokens 的训练文件，经过 3 个 epoch 的训练，预计成本为 $2.40。

Microsoft 作为 AI Builder 和 Power Virtual Agents 服务的一部分，同样提供可微调的 GPT 基础模型，可与公司的内部数据相连接，用以生成相应的回应。Microsoft 指出，这些模型可用于生成摘要信息或电子邮件内容。与 OpenAI 的微调机器人一样，Microsoft 的定制化 AI 机器人也能够与公司数据连接，从业务知识库中生成回应。

OpenAI 开放 GPT-3.5 Turbo 自定义微调

OpenAI 开放 GPT-3.5 Turbo 自定义微调

Recommend

东方甄选入淘宝但超级头部或难再有_原创_科技频道首页_财经网 - CAIJING.COM.CN

iTWire - US lobby group claims Huawei trying to get around US sanctions: report

打造潮流差异化符号！闻庆市时隔20年首次推出新LOGO

GitHub - Black-Kamelia/Sprinkler: A non-intrusive set of extensions sprinkled ov...

JPMorgan exec: Why and how decarbonization became a megatrend

Understanding Automatic Differentiation in 30 lines of Python

用龙泉青瓷还原游戏内容，《原神》非遗系列纪录片推出新作

【pandas小技巧】--DataFrame的显示样式 - wang_yb

简约的力量！利郎LOGO焕新背后的设计哲学

问题排查：nginx的反向代理感觉失效了一样 - 三国梦回

About Joyk