5

Claude 3大模型引起学界关注,业内人士:或将开启科研新范式

 6 months ago
source link: https://www.mittrchina.com/news/detail/13084
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

麻省理工科技评论-Claude 3大模型引起学界关注,业内人士:或将开启科研新范式

Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
在内容创作领域,该模型的多模态整合功能有助于处理照片、图像、视频等各种格式编码的数据,并在此基础上为艺术家和内容创作者提供创意想法、给予工作反馈。
280

破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被该模型颠覆的观点。

那么,这到底是一个怎样的模型?具有哪些出色的能力?又将会给哪些领域带来潜在改变呢?

a31090cb162e4295956099d67634067b~tplv-obj.image?lk3s=ef143cfe&traceid=202403111828218F23CC511ED5DE05B92B&x-expires=2147483647&x-signature=xLotkAhn6t6Ozh%2BX3aIaoFRMS7w%3D
(来源:Anthropic 官网)

包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越

如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是该领域知名公司之一[1]。

它由几位来自 OpenAI 的前员工创立,因开发具有强大、可扩展和可解释性的 AI 大模型 Claude 而获得广泛关注。

日前,该模型已实现第三版迭代,并在多个领域和任务中展现出卓越的智能水平,为计算机视觉和图像理解应用开辟广阔的可能性。

e29527a3e3ae41fea00f99933d843adf~tplv-obj.image?lk3s=ef143cfe&traceid=202403111828218F23CC511ED5DE05B92B&x-expires=2147483647&x-signature=xwgqsXlr9W8RXjC5nhGPxzvUu64%3D
(来源:Anthropic 官网)

据了解,Claude 3 模型家族共有三款模型,即 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus(能力逐级递增),并且都提供了强大的性能,便于用户根据智能、速度和成本选择适合自己的那款[2]。

目前,用户已经能够从 Claude 官网和 API 访问该模型家族。

从关键特性上看,Claude 3 相较于前几代模型,在自然语言理解和处理、情境意识、多模态整合、负责任的设计等方面均拥有更好的表现。

具体来说:

其一,自然语言理解和处理能力显著增强,不仅能够更加准确地理解和解释人类语言,让对话和交互更为直观和自然,还可以接受超过 100 万 token 的输入,并通过超强的回忆能力有效处理长上下文提示。

其二,由于拥有良好的情境理解和适应能力,以及涵盖科学技术、艺术文化等广泛主题的知识库,因此该模型可以在分析用户语言、语气和意图的细微差别的基础上,为用户提供准确和富有洞察力的响应。

其三,擅长处理和解释多模态数据,也就是能通过对文本、图像、视频等模态的处理,为多媒体分析和内容创作领域的应用提供助力。

其四,该模型的设计基于强大的保障措施和原则进行,能够保证减少偏见、尊重隐私,以及提高安全性和透明度。

另外,从训练 Claude 3 模型用到的数据和硬件来看,前者主要来自该公司的非公开内部数据、公开数据和第三方数据集,后者采用了由亚马逊 AWS 和谷歌云提供的硬件。

40553fa6fddb461dba1f148ae6191d06~tplv-obj.image?lk3s=ef143cfe&traceid=202403111828218F23CC511ED5DE05B92B&x-expires=2147483647&x-signature=nhVTNT2%2FVh%2BJOfxJaTnFU%2BSepUI%3D
图丨Claude 3 与同行模型在多个性能基准上的比较(来源:Anthropic 官网)

或颠覆科研、内容创作等领域,在处理涉及深厚专业知识的任务上比 GPT-4 更具优势

显而易见,基于上述能力,Claude 3 的潜在应用有望延伸至教育、内容创作、客户服务和科学研究等众多行业领域。

例如,在教育领域,该模型能够凭借广泛知识库和情境意识理解能力,扮演虚拟导师等角色,来为用户提供个性化的学习体验。

在内容创作领域,该模型的多模态整合功能有助于处理照片、图像、视频等各种格式编码的数据,并在此基础上为艺术家和内容创作者提供创意想法、给予工作反馈。

在客户服务领域,用户可以通过该模型处理客户查询、提供定制化建议,以提高客户满意度并缩短响应时间,进而增强客户服务和运营效果。

在科学研究领域,利用该模型分析大量数据、识别模式和生成假设的能力,有助于来自化学、物理学等领域的科研人员获得更多突破性的科学发现,以更好地推进科学知识的发展。

而如上所说的破解量子算法、短短几小时给出科研者用数月才能得出的研究方案等内容,就体现了 Claude 3 为科研领域带来的影响。

对于这一影响,中国科学技术大学博士研究生方俊峰表示:“通过几天的测试,我的直观感觉是,Claude 3 确实在复杂的定性科学任务上表现更出色,回答也更详实。

有相关想法/实验的科研人员都可以咨询一下它,说不定能得到一个值得一试的靠谱先验。”

哈尔滨工业大学、清华大学联合培养博士研究生齐弼卿则认为:“得益于结构化文档信息和长文本技术的加持,Claude 3 在特定科学领域展现出卓越的表现,甚至初步具备‘知识发现’的能力。

这对于学术界而言,意味着创新生产力形态变革升级的可能性,有望重塑认知行为合作模式,开启科学研究的新范式,加速 AGI 的内在可持续、自我价值进化的到来。(我们团队首次在 2023 年做过大模型是否具备假设提出能力的验证[1],很初步,但是个有意思的尝试。)”

此外,也有研究者从推理、准确性、负责任等维度出发,基于早期基准测试和现实世界测试,对比了 Claude 3 和 GPT-4 两款业界领先的大模型。

结果发现,前者在涉及需要深厚专业知识和数据分析的任务,以及可信度和透明度等方面,比后者更具优势。

总的来看,Claude 3 的诞生是 AI 领域发展的一个重要进展,由它带来的潜在应用也值得我们期待。

但与此同时,与任何 AI 模型一样,开发者和使用者也应该审慎并负责地利用该模型,尽可能地避免来自道德、偏见等方面的风险。

参考链接:

1.https://www.anthropic.com/company

https://arxiv.org/abs/2311.05965

2.https://www.anthropic.com/news/claude-3-family

https://anakin.ai/blog/is-claude-3-self-aware/

https://www.theverge.com/2024/3/4/24090087/anthropic-claude-3-opus-ai-chatbot-multimodal

https://claudeai.pro/is-claude-3-available-yet/

https://zontal.io/claude-3-the-next-generation-of-ai-assistants/

https://medium.com/aimonks/anthropics-claude-3-revolutionizing-complex-visual-data-analysis-19551148caca

https://anakin.ai/blog/claude-3/#how-does-haiku-compare-to-gpt-4-in-performance-and-cost

运营/排版:何晨龙


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK