4

打造ChatGPT平替,成本暴降95%!OpenAI硬核更新下月发布,视觉API要来

 11 months ago
source link: https://www.51cto.com/article/769763.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

打造ChatGPT平替,成本暴降95%!OpenAI硬核更新下月发布,视觉API要来

作者:新智元 2023-10-13 13:12:27
为了吸引更多开发者,OpenAI正在计划一波重大更新,并且让构建ChatGPT应用的成本降低多达20倍!

天下开发人员,苦OpenAI模型价格久矣。

路透爆料称,在11月6日首届开发者大会上,OpenAI将推出年度重磅更新:

在开发工具中增加内存存储(memory storage)功能,让API成本大幅降价95%。

也就是说,开发者苦等的福音终于来了,未来能够以更低成本、更快速度用GPT模型构建应用。

另外,OpenAI还计划推出「视觉」能力加持的全新开发工具。

这样,开发者可以构建「分析图像」和「描述图像」更强大的应用。

45fa5c5535d164f3e319724639b69de5a38d64.png

这些新功能的开放,最终指向着一个共同的目标:构建大模型加持的AI智能体。

OpenAI此举正沿着Sam Altman设想一步步推进,不仅在用户中打开市场,同时还要成为一个提供热门开发者平台的公司。

OpenAI把价格打下来了

去年11月,ChatGPT横空出世,吸引了全球数亿人使用,创下消费级应用用户数增长里程碑。

除了网页版,ChatGPT还推出了iOS版,以及安卓版程序。

这样客观的下载量,将为OpenAI带来一些盈利。内部高管预计,今年将带来2亿美元的收入,24年将有10亿美元到账。

51b2e4278691fc15fcd35732d9a7a21c4a83e9.png

可见,ChatGPT在消费者群里中已经打下了江山,但在开发圈子里,让开发者基于OpenAI技术构建业务,却面临重重挑战。

在首席执行官Altman看来,让OpenAI成为其他构建应用程序公司不可或缺的一部分,是公司的战略目标之一。

他与开发者会面,急切地表达基于OpenAI模型构建新生态系统的愿望。

目前,GPT模型能力已经融入到了,美版「饿了么」DoorDash、写作助手Jasper等无数应用程序中。

但,这还远远不够。

6月,Sam Altman在AI开发平台Humanloop的首席执行官采访中,曾透露了自家的未来产品路线图。

其中提到了一点是「有记忆的API」(Stateful API)——目前大部分token被浪费在上文的传输中,将来会有一个能够记住对话历史的API版本。

b3adb2a09a90d80f48117703106a78332ddd72.png

这恰恰与添加「内存存储」的想法不谋而合。增加这一功能可以优化成本的原因有以下几点:

- 新的缓存功能与LangChain的记忆链(Memory Chain)原理类似,可以将之前的对话历史转化为嵌入式向量进行存储。新的会话内容只需在增量标记中进行处理,而无需重新输入整个上下文。

55009a64009f218d61e36667d3a555df302f29.png

- 预设的角色和功能也无需重新输入,只需进行相似性搜索即可。

- 在模型计算过程中,CUDA图形只需查看增量,而无需以历史聊天记录为基础,再次进行全局浏览。

简而言之,这将大大优化token数量。

a50ed8633d3cdd16bb522095f558ca92ac599e.png

所谓的「有记忆的API」的计划发布,能够使模型通过记住查询的对话历史,进而创建应用程序成本更低。

这可能会大大削减,开发人员需要支付API费用。

根据OpenAI官网上的定价,目前,用GPT-4处理一页文档可能需要10美分,具体取决于输入和输出的长度和复杂性。

另一个更新是视觉API,允许开发者构建可以分析图像的软件。

这也标志着,OpenAI继续向前推进多模态能力重要的一步,未来必定还会有音频、视频能力的加入。

抓住开发者, 在做了

为了吸引更多开发者,OpenAI也做出了很多努力。

去年,专门聘用了第一位负责建立OpenAI与开发者关系的工程师Logan Kilpatrick。

d4e21e98119e412e85710178238a31d4cfecda.png

他常常会更新一些利好开发者的工具和内容。

微调用户界面现在支持在用户界面中进行端到端作业创建,无需代码即可启动作业。

e4f3a11144a92c82e73476dd963e86732f7776.png

还有,OpenAI即将发布OpenAI Python SDK的1.0版本。

a7ca03c855179c04d68191eb40bba3401093ad.png

发布API 使用情况仪表板的更新,有助于更清楚地了解哪些模型在推动使用情况,而且总体上应该更加可靠。

f4172f47955c69ef30a546eb9a8d2ded625721.png
27445b022a536b656c68569804db8486f4c296.png

除此之外,可以看到OpenAI面向开发者,做了很多模型适配、用户界面等各种工作的优化。

89cf5cd780098659836608801ca1f988727c36.png

而所有的这些,都是为了吸引更多开发者来付费使用OpenAI的模型。

根据PitchBook的数据,今年各家AI初创公司已经获得了超过200亿美元的投资。

虽然其中很多都依赖OpenAI提供的技术,但这些初创公司也在努力使它们使用的模型更加多样化,比如采用Llama这种开源方案。而这也使得OpenAI必须将自己与谷歌等资金雄厚的竞争对手区分开来。

据路透社报道,保持开发者的满意度一直是OpenAI的关注重点。

然而,即便ChatGPT在消费者中取得了巨大成功,但OpenAI在赢得其他公司或开发者的支持上,却并没有那么顺利。

比如备受期待的ChatGPT插件系统,在最初引发了一大波热潮之后,用户和开发者的兴趣便急剧下降。

随后Sam Altman也承认,插件并没有像想象中那样获得市场的认可。

57b3dd274d96856ee08167a6a1e9c78c12e0e5.png

GPT-4

d313c0f60d50c9da1f3866947137dd37373ffd.png
07410026615d39be04f8464d6670ce6ce11ae9.png

GPT-3.5 Turbo

a79ce6d824f0408184c13752afcba56237be4a.png

微调模型

3187d7994bfd8d9001a410159d9bd1baec8b31.png
责任编辑:张燕妮 来源: 新智元

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK