5

Claude加速上新:基础版数学编程双提升,「幻觉」也更少,CEO:两三年内AI将成高知人...

 1 year ago
source link: https://www.qbitai.com/2023/08/75416.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Claude加速上新:基础版数学编程双提升,「幻觉」也更少,CEO:两三年内AI将成高知人类

head.jpg西风 2023-08-10 14:49:53 来源:量子位

Claude Instant推出1.2版

西风 发自 凹非寺

量子位 | 公众号 QbitAI

“ChatGPT最强竞品”Claude基础版上新——

更轻、更快、价格只要Claude 2六分之一的Claude Instant推出1.2版本。

在这次更新中,官方提到基础版Claude Instant吸纳了高性能型号Claude 2的优势,编码、数学能力经测试比原来提升近六个百分点。

是加量不加价的感觉了(手动狗头)。

9a7c9d04e3f3a891f784cc23e26eccc5.gif

目前,全新Claude Instant 1.2已可申请通过API部署,一起来康康都做了哪些更新。

更快,更便宜

具体来说,Claude Instant 1.2在编码、推理等方面的能力有所提升。不仅能生成更长、结构更好的回复,还能更好地遵循格式化指令,在引用提取、多语言能力和问答方面也有了一些改进。

7f5ac376aa82b9f865572edf7e91f4dd.gif

在Codex评估(编码性能测试)中,Claude Instant 1.2达到58.7%,而1.1版本为52.8%。

在GSM8K基准测试(数学能力测试)中,同样提高了近六个百分点,1.2版本得分为86.7%,1.1版本的得分为80.9%。

298bb359b665babb7e95690e986f59c8.png

△Claude Instant 1.1和1.2的性能比较

此外,Claude Instant 1.2还提高了安全性,产生“幻觉”更少,对“越狱”的抵抗力更强。

5619d72fffcc7d3f01ea2b306764b58a.png

△Claude不同模型安全性评估,越低越好

在上下文窗口长度上,Claude Instant 1.2与Claude 2相同,都是10万token,相当于75000个单词,差不多是一本《了不起的盖茨比》的长度。

再来看看买下这些功能要花多少钱,Claude Instant系列定价比Claude 2便宜,但都是分输入和输出两部分定价。

Claude Instant的Prompt定价是每100万token 1.63美元,Completion定价是每100万token 5.51美元:

a85609309a1e2ff459420d2a73cebb29.png

挑战OpenAI

Claude背后公司为Anthropic,想必大家也不陌生了。

Anthropic由OpenAI前研究副总裁Dario Amodei带头于2021年成立。

ee964d9b7a60397502db003d8ed9d569.jpeg

离开OpenAI时,Dario Amodei可谓带走了一批核心人才,这里面就包括GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐)。

眼下,Anthropic曾表示目标是建立一个“前沿模型”,会比当今最强的AI再强10倍,并认为这是“AI自学的下一代算法”(next-gen algorithm for AI self-teaching)。这个前沿模型可用于构建虚拟助手,回复电子邮件,进行研究,生成艺术品、书籍等。

目前Anthropic已融资14.5亿美元,但这还远远不够,他们预计未来两年内需要50亿美元用于AI研发。

最近Dario Amodei也公开表示:

让模型像一个受过良好教育的人,可能离我们并不遥远,我认为在两三年内就有可能实现。

6cb600a824da7e22ef2caec184f2d866.gif

外媒TechCrunch认为,Anthropic现在推出新版Claude Instant是为了与OpenAI以及Cohere、AI21 Labs等初创公司提供的类似基础产品竞争。

Anthropic目前拥有众多客户和合作伙伴,其中就包括“美国知乎”Quora。

虽然,Claude Instant 1.2目前只有API版本,但在Quora旗下的Poe.com上大家可以免费试用Claude Instant。

9e1afd08f9bc464593b1478e06598d0f~tplv-tt-shrink:640:0.image?traceid=202308101440094112C8F09DFD97F5B5A2&x-expires=2147483647&x-signature=csS3ZAhZPVOrqqlAGBnpBRPRk8k%3D

参考链接:
[1]https://twitter.com/karinanguyen_/status/1689318903670063104
[2]https://twitter.com/_akhaliq/status/1689334269137543173
[3]https://techcrunch.com/2023/08/09/anthropic-launches-improved-version-of-its-entry-level-llm/

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK