4

阿贡实验室将建成两百亿亿次峰值性能的超级计算机,搭载英特尔CPU和GPU,以用于解决大...

 2 years ago
source link: https://www.mittrchina.com/news/detail/10577
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

麻省理工科技评论-阿贡实验室将建成两百亿亿次峰值性能的超级计算机,搭载英特尔CPU和GPU,以用于解决大规模科学计算问题

阿贡实验室将建成两百亿亿次峰值性能的超级计算机,搭载英特尔CPU和GPU,以用于解决大规模科学计算问题
当地时间 5 月 10 日,美国阿贡国家实验室(Argonne National Laboratory)副主任瑞克·史蒂文斯(Rick Stevens)在英特尔 Vision 2022 会议上表示,“
280



e4b8ab7a7b214a55ba8fd7dd1eb40fa3

当地时间 5 月 10 日,美国阿贡国家实验室(Argonne National Laboratory)副主任瑞克·史蒂文斯(Rick Stevens)在英特尔 Vision 2022 会议上表示,“极光”(Aurora)超级计算机已经处于建造之中。团队成员正在一个占地1万平方英尺的区域内,安装 Aurora 的机架、存储系统和冷却基础设施。

4a1202ee26c04e429e456dd699538a2a
(来源:阿贡国家实验室)

据悉,该超级计算机预计在 2022 年晚些时候部署完成,有望提供超 2 exaflops(每秒百亿亿次)的峰值性能,是美国首批百亿亿次级超级计算机之一。它首次宣布于 2015 年,原本计划 2018 年建成,当时规划速度每秒 180 petaflops(千万亿次),后被推迟,性能也成倍提升。

Aurora 由英特尔和美国超级计算机制造商 Cray(惠普子公司)负责构建,将搭载第四代至强(Xeon)可扩展 CPU(代号为 Sapphire Rapids,拥有高带宽内存)和代号为 Ponte Vecchio 的数据中心 GPU。其每个计算刀片都有两个 Sapphire Rapids(总数约 2 万)和 6 个 Ponte Vecchio(总数约 6 万)。

同时,借助 oneAPI,对整个系统中的节点进行编程,无需更改代码,应用程序可以有效在 CPU 和 GPU 上运行,为开发人员提供无缝系统集成。

2952d75edaff40ab85aa65c126d8b0e6
(来源:资料图)

值得一提的是,Aurora 将可用于学术和商业用途。通过对世界的科学模拟来解决人类面临的一些最复杂的挑战,覆盖亚微米级到整个银河系尺度。

史蒂文斯在会上提到,“我们需要大量的计算能力来解决仿真问题,无论是预测未来的气候、设计新电池、改善制造,还是发现新的癌症治疗方法和研究新药,以及对元宇宙进行原型设计等。”

据了解,目前,已经有至少十多个研究团队正在通过阿贡领导力计算设施(Argonne Leadership Computing Facility,ALCF)参加“极光”早期科学计划(Aurora Early Science Program),以在 Aurora 正式建成之后,能够第一时间利用此百亿亿次级机器进行科学研究。

比如,这之中有来自杜克大学助理教授阿曼达·兰德尔斯(Amanda Randles)领导的一个项目,其将使用 Aurora 来推进癌症研究。

她和她的团队开发了一种模拟全身血液流动的模型,希望用它来预测癌细胞在微观水平上的运动。

cf7b75862afb4081b8317db353fae97d
(来源:阿贡国家实验室)

模拟癌细胞在人体中的扩散过程需要强大的计算能力来实时处理大量数据集。随着 Aurora 的推出,兰德尔斯团队有望获得有关癌症新药和治疗方法的关键见解。

Aurora 还可帮助研究人员绘制大脑的精确地图,可体现出每个神经元之间的每个连接以及相关树突、轴突和突触的精确位置。

“利用当前超级计算机来计算老鼠大脑,可能需要花费 100 万天。而 Aurora 则可将这一时间缩短到 1000 天。”阿贡国家实验室高级计算机科学家尼古拉·费里尔(Nicola Ferrier)说到。

此外,还有团队将 Aurora 与大型强子对撞机集成在一起来寻找新的物理发现,或是用于帮助聚变反应的实现等。

值得一提的是,Aurora 本计划是作为美国第一个百亿亿次级超级计算机,但随着接连被推迟,这一头衔或让给美国橡树岭国家实验室(Oak Ridge National Laboratory)的名为“边境”(Frontier)的 1.5 exaflops 超级计算机。该实验室在 2022 年 3 月曾表示,Frontie 的完整系统将在今年 7 月为早期科学做好准备。

另外,美国劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory)还正在开发埃尔卡皮坦(El Capitan)超级计算机,有望在 2023 年交付。El Capitan 预计有着超过 Aurora 的峰值性能,功耗在 30MW 以下。

据了解,阿贡国家实验室是美国第一个国家实验室,受到美国能源部(Department of Energy,DOE)赞助。其在几乎所有科学学科中开展前沿的基础和应用科学研究。该实验室与数百家公司、大学和政府机构的研究人员保持着密切合作,帮助他们解决具体的科学和技术问题。

随着 Aurora 即将推出,该实验室正在接受需要解决大规模科学计算问题的研究人员的预订,以便当 Aurora 首次运行时就可运行提前构建好的应用程序。

百亿亿次级的超级计算机将使科学家和工程师能够超越传统的基于仿真的研究,将给数据科学和机器学习方法等新兴计算技术带来根本性转变。

最后,作为 Aurora 的设计参与方之一的英特尔,在本次 Vision 2022 会议上还发布了用于训练和推理的第二代深度学习处理器 Habana Gaudi 2。该处理器来自于该公司专注于 AI 深度学习处理器技术的数据中心团队哈伯纳实验室(Habana Labs)。

该实验室表示,Gaudi 2 采用 7 纳米技术,在 ResNet-50 计算机视觉模型、BERT 自然语言处理模型上的训练吞吐量性能是英伟达 A100-80GB GPU 的两倍。

据了解,Gaudi 2 将在今年年底前应用到服务器上。而英特尔用在 Aurora 上的 Ponte Vecchio 将在 2023 年推向更广阔的市场。

-End-

5e12d830085d460c9e4c95dd4757f7cd

参考:
https://www.hpcwire.com/2022/05/10/aurora-installation-underway-now-open-for-reservations/
https://www.intel.com/content/www/us/en/newsroom/news/vision-keynote-day-1-live-blog.html#gs.zl9m1m
https://www.anl.gov/article/preparing-for-exascale-argonnes-aurora-supercomputer-to-drive-brain-map-construction
https://www.anl.gov/article/preparing-for-exascale-aurora-supercomputer-to-help-scientists-visualize-the-spread-of-cancer
https://www.intel.com/content/www/us/en/newsroom/news/vision-2022-habana-gaudi2-greco.html#gs.zm6m3g

72ab2cb74fb148bbb1281e69d3a286a8

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK