8

Cerebras发布WSE-3:采用5nm工艺,4万亿个晶体管,90万个AI核心 - 超能网

 6 months ago
source link: https://www.expreview.com/92767.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Cerebras发布WSE-3采用5nm工艺,4万亿个晶体管,90万个AI核心

吕嘉俭发布于 2024-3-14 11:36

本文约 550 字、3 张图表,需 1 分钟阅读

Cerebras宣布,推出Wafer Scale Engine 3(WSE-3),这是世界上尺寸最大的单颗裸片,几乎等于一块12英寸晶圆。其专为训练业界最大的AI模型而打造,在相同的功耗和价格下,性能是现有最快AI芯片WSE-2的两倍。WSE-3将用于Cerebras CS-3 AI超级计算机,通过2048个节点提供高达256 exaFLOPs的计算性能。

Cerebras_WSE3_1.jpg

WSE-3的主要规格:

  • 4万亿个晶体管

  • 900,000个AI核心

  • 44GB的片上SRAM缓存

  • 台积电5nm工艺制造

  • 可选1.5TB / 12TB / 1.2PB三种内存容量

  • 125 petaflops的峰值AI算力

  • 可训练多达24万亿个参数的人工智能模型

  • 可达2048个CS-3系统的集群规模

Cerebras表示,WSE-3专为满足企业和超大规模需求而构建,旨在训练比GPT-4和Gemini大10倍的下一代前沿模型,24万亿个参数模型可以存储在单个逻辑内存空间中,无需分区或重构,从而大大简化了训练工作流程,提高了开发人员的工作效率。

Cerebras_WSE3_2.jpg

最新的Cerebras软件框架为PyTorch 2.0和最新的AI模型和技术提供原生支持,比如多模态模型、视觉转换器、专家混合和扩散等,仍然是唯一一个为动态和非结构化稀疏性提供原生硬件加速的平台,可以将训练速度提高8倍。

Wafer Scale Engine系列规格参数对比
型号WSEWSE-2WSE-3英伟达A100英伟达H100
晶体管数目(亿)120002600040000540800
核心面积(mm2)462554625546255826814
制程16nm7nm5nm7nm5nm
AI Cores4000008500009000006912 FP32
432 Tensor
16896 FP32
528 Tensor
芯片缓存容量18GB40GB44GB40MB50MB
缓存带宽9 PB/s20 PB/s21 PB/s1555 GB/s3146 GB/s
互联带宽100 Pb/s200 Pb/s214 Pb/s600 GB/s900 GB/s
超 能 网 制 作

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK