发展历程



第一阶段:在2021年初开始安装,会有12个GPU加速机柜,可容纳1536个节点,35PB全闪存存储,具有5TB/s的数据传输速度。每个节点都有一个AMD EPYC 7763处理器,以及256GB内存和四个通过NVLink连接的Nvidia A100 40GB GPU。在这个时期,Perlmutter可以提供60 PetaFLOPS的FP64性能,或3.823 ExaFLOPS的FP16性能。这样的性能足够让Perlmutter进入世界超算系统排名前十的位置。


第二阶段:在2021年稍晚的时候开始,将增加12个CPU机柜,采用纯CPU节点,总共有3072个节点,都使用AMD EPYC 7763处理器。每个节点拥有512GB内存,其FP64性能达到了120 PetaFLOPS左右。


技术架构



硬件层面

计算节点

CPU: 每个计算节点配备了AMD EPYC处理器,这些处理器基于Zen 3架构,具有高性能核心和高带宽内存接口。


GPU: 每个节点还包含多个NVIDIA A100 Tensor Core GPU加速器,这些GPU基于Ampere架构,提供卓越的浮点运算和AI加速能力。[1]

内存与存储

内存配置:每个节点配备256GB DDR内存。,在某些配置中,每个节点拥有512GB内存。


存储: Perlmutter采用了多层存储架构,包括高速NVMe固态硬盘和大规模并行文件系统,如Lustre,以支持大数据集的高效读写操作。[2]

网络与能耗

互联技术: 使用Cray Slingshot互连技术,这是一种低延迟、高带宽的网络架构,专门设计用于超级计算环境,以确保计算节点间的数据传输速度和效率。

液冷技术: Perlmutter采用了高效的液体冷却解决方案,以保持系统的稳定运行和降低能耗。[3]

软件层面

编译器与开发工具

Perlmutter提供了多种编译器,包括CCE、GNU和LLVM编译器。


用户可以通过“programming environment”模块选择所需的编译器,并使用CC(针对C++)或cc命令进行编译,这些命令会自动调用编译器并启用一些特定的优化标志,如-march=native。[3]

所获奖项



2021年11月,Perlmutter获得TOP500排行榜第5名。
2022年6月,Perlmutter获得TOP500排行榜第7名。
2022年11月,Perlmutter获得TOP500排行榜第8名。
2023年6月,Perlmutter获得TOP500排行榜第8名。

应用领域



拼接宇宙 3D 地图

Perlmutter 系统通过处理来自 DESI 的数据,协助研究人员绘制跨越 110 亿光年的可见宇宙图。在过去,研究人员的工作流程需要几周甚至是几个月的时间,但 Perlmutter 将能够在短短几天内完成任务。在早期的基准测试中,NERSC 研究人员也曾报告说,使用 GPU 的性能加速提高了 20 倍,这将使他们的工作流程缩短到几个小时。[4]



关于劳伦斯伯克利实验室[5]




历史背景

成立于1931年,最初名为“劳伦斯辐射实验室”(Lawrence Radiation Laboratory),由诺贝尔物理学奖得主欧内斯特·奥兰多·劳伦斯(Ernest Orlando Lawrence)创建。


实验室的创建初衷是为了进行基础物理学研究,尤其是与粒子加速器相关的研究,劳伦斯发明的回旋加速器就是在这里得到发展和应用的。


在第二次世界大战期间,实验室参与了曼哈顿计划,对原子弹的研制做出了重大贡献。


1971年,实验室正式更名为劳伦斯伯克利实验室(Lawrence Berkeley Laboratory)。


1994年,再次改名为劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)。

组织架构与管理

LBNL隶属于美国能源部(DOE),由美国能源部直接资助和支持。


实验室的具体运行由加州大学(UC)系统管理,主要是在加州大学伯克利分校(UC Berkeley)的监督下运作。

研究领域

LBNL的研究覆盖了广泛的学科,包括基础物理学、化学、材料科学、生物学、环境科学、地球科学、能源科学和技术、计算科学等。


实验室拥有多个研究中心和设施,比如先进光源(Advanced Light Source, ALS)、分子铸造厂(Molecular Foundry)、国家能源研究科学计算中心(NERSC)等。

NERSC与Perlmutter

NERSC是LBNL的一部分,专注于为美国能源部和科学界提供高性能计算资源。


Perlmutter超级计算机是NERSC的旗舰系统,专门为支持科学计算、大数据分析和人工智能应用而设计。


Perlmutter的建造和运行代表了LBNL在推动计算科学前沿方面的重要角色。

社会贡献与影响

LBNL及其研究人员对科学界有着深远的影响,实验室的科学家们已经获得了13项诺贝尔奖。


实验室致力于将基础研究转化为实际应用,推动科技创新和经济发展。

推荐阅读



  1. 6159个A100,每秒4百亿亿浮点运算,全球最快AI超算Perlmutter上线
  2. 融合AI和高性能计算的超级计算机——Perlmutte
  3. 研究人员开始启用全球最快AI超级计算机 Perlmutter
  4. 暗能量奥秘或被揭晓?美国官方启用号称全球最快的超级计算机Perlmutter,将协助拼装迄今最大的宇宙三维地图 | 独家解析
  5. 全球最快AI超级计算机开动,每秒4百亿亿浮点运算!正拼接最大宇宙3D地图
  6. 美国即将建成全球“最强”AI超级计算机,计划创建迄今为止最详尽的宇宙3D星图


参考资料



【1】AMD EPYC处理器助力提高Perlmutter超级计算机的高性能计算能力

【2】美国新超算Perlmutter正式启用,采用AMD EPYC处理器和英伟达A100加速卡

【3】全球最快AI超级计算机开动,每秒4百亿亿浮点运算,正拼接最大宇宙3D地图

【4】研究人员启用全球最快 AI 超算 Perlmutter,将拼接最大宇宙 3D 地图

【5】百度百科:劳伦斯伯克利国家实验室

点赞(0)

微信公众账号

微信扫一扫加关注

返回
顶部