1

英伟达正在研究各种多芯片GPU设计方案,可根据不同工作负载做针对性组合

 2 years ago
source link: https://www.expreview.com/81774.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

英伟达正在研究各种多芯片GPU设计方案,可根据不同工作负载做针对性组合

吕嘉俭发布于 2022-1-8 15:48
本文约 1180 字、3 张图表,需 2 分钟阅读

英伟达下一代将面向数据中心和消费市场,分别推出基于Hopper架构和Ada Lovelace架构的GPU。有所不同的是,英伟达只在Hopper架构GPU上采用MCM多芯片封装,Ada Lovelace架构GPU仍会保留传统的设计,并不会像AMD基于RDNA 3架构的Navi 31那样,将MCM多芯片封装引入到消费级GPU。

NVIDIA_A100.jpg

近期,英伟达研究人员发表了一篇文章,详细介绍了英伟达正在探索如何为未来产品部署多芯片设计方案。随着异架构计算的兴起,英伟达正在寻找一种方法,增加其半导体设计的灵活性,以根据工作负载的不同,灵活匹配各种模块,这也是MCM多芯片封装的用武之地。

英伟达对多芯片设计的研究最早是在2017年被曝光,当时英伟达展示了通过四个小芯片构建的设计方案,不但提升了性能,还有助于提高产量(较小的芯片良品率会提高),而且还允许将更多的计算资源集合在一起。多芯片设计还有助于提高供电效率,以及有更好的散热效果。

英伟达目前在MCM多芯片封装GPU上的做法称为“Composable On Package GPU”,或COPA。文章里阐述了英伟达如何处理HPC和AI工作负载之间的差异,随着两者计算需求的变化,对计算的要求也渐行渐远。英伟达担心,过于单一的GPU架构,会逐渐失去HPC和AI工作负载中的计算优势,而两者的市场规模却在日益增长。

NVIDIA_MCM_1.jpg

为了更好地应对未来的计算需求,英伟达一直在模拟不同的多芯片设计和配置,确认不同工作负载所需要的硬件模块情况。根据英伟达提供的数据,在HPC工作负载上,减少25%的显存带宽实际上只降低了4%的性能,如果再减少25%,性能损失则再增加10%。因此,减少50%的显存带宽并移除相关硬件模块后,可以替换成更合适的硬件模块,为对应的工作负载提供相应的性能,从而提高效率。由于并不是所有硬件模块都是对等的,个别功能是不可或缺的,COPA是英伟达尝试模拟多芯片设计的影响,以及与性能之间的关系。

英伟达目前优先考虑的是HPC和AI市场,除了高利润的因素以外,不少企业通过定制解决方案的做法逐渐蚕食着英伟达的市场空间。当然,这种根据工作负载做针对性配置的做法也可以应用与英伟达其他GPU产品线,包括消费市场的GeForce显卡。不过与专业市场不同,游戏中的渲染工作方式有着本质上的区别,如果采用多芯片设计,则需要进一步提高小芯片之间的互联速度。

NVIDIA_MCM_2.jpg

此前AMD已谈及了其3D堆栈技术的发展方向,表示封装选择和芯片架构取决于具体产品的性能、功率、面积和成本,AMD称之为PPAC。如果将已经发布和即将推出的产品包括在内,AMD有14种多层小芯片设计的封装架构正在进行中。AMD认为,未来属于多芯片的模块化设计和匹配协调的封装。

AMD已通过X3D封装的产品迈出了第一步,在CPU上展示了对成本、功耗和性能等方面的影响。在GPU上采用同样的设计会更为困难,不过技术的发展最终会推动英伟达实现多芯片设计的目标,即由多个不同功能模块的小芯片组成GPU,可以根据工作负载的计算需求做出更专业化的组合。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK