比计划晚了一点,由英特尔和惠普(HPE)共同开发、安装在阿贡国家实验室的超级计算机“极光”终于完成了。这个高性能计算 (HPC) 市场的后起之秀理论上能够每秒进行大规模计算,为科学界提供前所未有的模拟能力。
Aurora 原计划于 2021 年完工,现已在阿贡领导计算设施 (ALCF) 数据中心安装了全部 10,624 个计算刀片。Aurora 由英特尔、惠普企业 (HPE) 和美国能源部 (DOE) 合作开发,预计将实现超过 2 exaflops(每秒 20 亿次运算)的理论峰值性能。
Aurora系统配置
每个刀片均配备两个 Intel Xeon Max 系列 CPU 和六个 Intel Max 系列 GPU,以及高性能应用程序所需的所有内存、网络和冷却技术。总体而言,Aurora 拥有 63,744 个 Intel GPU 和 21,248 个 Intel Xeon CPU、超过 1,024 个分布式存储节点、230 PB 的存储容量和 31 TB/秒的聚合带宽。
根据官方资料,Aurora的每个刀片服务器重约70磅(31.75千克),采用垂直安装方式、液冷散热方案,需要专业的机器辅助安装到机架上,操作过程需要十分精细。这一系统总计包含166个机架,每个机架可容纳8×8共64个刀片服务器,超级计算机总占地面积相当于两个专业篮球场。
Aurora 节点配置
Intel Xeon Max 系列 CPU
Intel GPU
Slingshot Interconnect
Aurora的互联网络采用的是Crary(HPE)的Slingshot网络,每台交换机拥有64个200Gbps端口;支持增强的拥塞控制、自适应路由、非常低的平均及尾部延时;采用的网络拓扑为Dragonfly,整个网络跳步数为3跳(交换机数量)。
Aurora Dragonfly拓扑连接
拥有230 PB 的存储容量和 31 TB/秒的聚合带宽的存储系统性能也是十分恐怖。
Aurora 存储系统
英特尔表示这套超算将会用于核爆、天气系统、医疗、动力学模拟等领域,都是超大尺度的模拟与计算,自然需要强大的算力提供硬件保证。
(如有版权问题,请联系删除)