1

【AI时刻】GPT-4最强对手出现!Claude-3 AI模型发布

 6 months ago
source link: https://diy.pconline.com.cn/1716/17165790.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

【AI时刻】GPT-4最强对手出现!Claude-3 AI模型发布

16842313353417900.jpg 月亮背面的外星人 责任编辑:sunaorui 发布于:2024-03-05 11:05 PConline原创

就当我们还在为OpenAI的Sora实际效果感到震撼,惊叹未来已来的时候。短短一个月,OpenAI的“家”就被人偷了,昨晚北京时间凌晨Anthropic公司宣布Claude-3正式发布,带有三个高性能的模型形态,并宣布在AI逻辑基准测试中超过了ChatGPT-4。

18392447.jpg

可能国内的小伙伴很少知道Claude,这是一个在海外备受关注且用户基数较大的一个AI模型,其从诞生以来就一直与GPT相爱相杀,在AI性能排行榜上紧追不舍。其也是基于GPT(Generative Pre-trained Transformer)技术的大型语言模型,通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。

18392461.jpg

亚马逊于今日宣布使用Claude3来优化其商业逻辑

该系列包含三款各具特色的型号:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,它们在性能与应用功能上各有侧重,旨在满足多样化的应用场景需求。

articleImageLoading.gif

Claude 3 Haiku

Haiku 型号凭借其极速处理能力和高性价比脱颖而出。它能够在短短三秒内完成对一篇含有约 10,000 个标记、信息浓缩且数据密集的 arXiv 研究论文的阅读工作,包括对图表和图形的理解。Haiku 尤其适用于那些对处理速度有极高要求但性能负荷相对较轻的平台。

Claude 3 Sonnet

Sonnet 型号在处理大多数工作负载时的速度是 Claude 2 以及 Claude 2.1 的两倍,且模型效果与性能一致,并提供更高层次的智能分析能力。它特别擅长处理那些需要快速反应的任务,例如知识检索和销售流程自动化等。

Claude 3 Opus

Claude 3 Opus 是系列中的高端型号,具备与市场上其他顶尖模型相匹敌的复杂视觉处理能力,能够处理多种视觉格式,包括照片、图表、图形以及技术图解。相较于 Claude 2.1,Opus 在解决开放性问题上的准确度提升了一倍,同时也显著降低了错误答案的比例。

其他亮点

全系列模型均能处理超过 100 万个标记的输入,为那些需要更强大处理能力的客户提供可靠支持。Claude 3 系列在执行复杂多步骤指令方面表现卓越,尤其在遵循品牌语调和响应指南上,能够为用户打造出值得信赖的客户体验。此外,这些模型还擅长生成流行的结构化输出格式,如 JSON。

目前,Opus 和 Sonnet 已经通过 API 对外开放,开发者现可直接注册并开始体验这些尖端模型的强大功能。比如,POE就已经支持Claude-3-Opus模型,购买POE“月卡”后就可以体验。

articleImageLoading.gif

超越GPT-4;兼顾视觉功能

根据Anthropic的说法,Claude 3 Opus 在10项人工智能标准测试中超越了GPT-4,包括MMLU(本科水平知识)、GSM8K(小学数学)、HumanEval(编程)以及HellaSwag(常识)。

articleImageLoading.gif

其中一些胜利的优势非常微小,例如Opus在MMLU五次尝试中得到86.8%的得分,而GPT-4得到86.4%,一些差距则较大,例如在HumanEval上Opus得到90.7%的得分,而GPT-4得到67.0%。这可能就意味着Claude 3对于新手码农要更加友好。

与前代模型相比,Claude 3系列在分析、预测、内容创作、代码生成以及多语言对话等方面展现了改进。据报道,这些模型还具备了增强的视觉能力,允许模型处理照片、图表和图解等视觉格式,类似于GPT-4V和谷歌的Gemini

在实际测试中,Claude 3相比于GPT-4V对于PDF的解读要更加快速,同时对于中文输出的逻辑与优化也要明显好于前代,也是达到了GPT-4平替的水准。

articleImageLoading.gif


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK