超级计算机作为尖端技术,其技术架构集成了最前沿的硬件组件与高度优化的软件系统,旨在实现前所未有的计算性能与数据处理能力。本文将从通用超级计算机专用超级计算机两个维度展开介绍它们的设计特点与关键技术。

通用超级计算机技术架构


通用超级计算机如“前沿”和“神威”,在硬件层面均采用了大规模并行的计算单元(CPU、GPU或众核处理器)、高速互连网络、大容量内存以及高效存储系统,以提供强大的计算能力和数据处理能力。在软件层面,它们运行定制化的Linux操作系统,支持多种并行编程模型,配备作业调度系统,并能够运行各类科学与工程应用软件。这些特性共同构成了通用超级计算机能够处理各种复杂计算任务的技术架构:

硬件层面

  • 芯片:超级计算机通常采用大量高性能的多核CPU,如Intel的Xeon或AMD的EPYC系列,这些处理器具备高频率、大缓存以及支持多线程等特点,以提供强大的并行计算能力。GPU作为协处理器在超级计算机中扮演重要角色,尤其是针对高度并行化的计算任务,如科学模拟、深度学习等。NVIDIA的Tesla或AMD的Radeon Instinct系列GPU常被用于提供额外的浮点运算能力
  • 处理器:高性能处理器的设计目标包括有效的性能扩展、资源的有效利用以及适应多样化应用。以“前沿”超级计算机为例,它采用AMD的第三代EPYC(霄龙)处理器,基于Zen 3架构,具有高核心数、高频率和强大的浮点性能。
  • 加速器:为了进一步提高性能,超级计算机还可能集成特定应用的加速器。例如,高性能可重配置计算机(HPRCs)结合了传统微处理器和现场可编程门阵列(FPGA),以提供针对特定应用优化的计算能力。如“前沿”超级计算机搭载AMD的Instinct MI250X GPU,该GPU基于CDNA 2架构,专为高性能计算和人工智能工作负载设计,支持大规模并行计算和张量计算。
  • 存储系统:通用超级计算机配备高性能并行文件系统和大规模存储设备,确保海量数据的快速读写和共享、及大规模并行计算中的高效数据交换。以“前沿”超级计算机为例,每个计算节点配备512 GB的HBM2内存,总内存容量超过1PB。
  • 互连网络:超级计算机的网络互连技术对于提高整体性能至关重要。各计算节点间通过高速、低延迟的网络互连技术(如InfiniBand、Omni-Path、Ethernet等)连接,实现节点间的高效数据传输和通信。网络拓扑结构可以是树状、环状、胖树、三维网格等多种形式,以优化不同工作负载下的通信效率。

软件层面

  • 操作系统:通常运行定制化的Linux操作系统,如Red Hat Enterprise Linux、CentOS或其他针对高性能计算优化的Linux发行版。
  • 并行编程模型与环境:支持多种并行编程模型和接口,如MPI(Message Passing Interface)、OpenMP、CUDA(对于配备GPU的系统)、OpenACC等,便于用户编写并行程序。
  • 作业调度系统:配备高级作业调度系统,如Slurm、PBS/Torque、LSF等,用于资源分配、作业提交、监控和管理。

专用超级计算机技术架构


专用超级计算机是高度定制化的专用系统,其设计和架构主要针对专业领域进行了深度优化,与通用超级计算机有着显著区别。通用超级计算机旨在提供广泛的计算能力,适用于多种科学和工程应用,而专用超级计算机如“安腾”则牺牲了通用性以换取在特定领域的极致性能。其技术架构如下:

硬件层面

  • 定制硬件加速器:专用超级计算机往往需要针对特定领域进行硬件定制,如“安腾超级计算机”采用了自主研发的专用硬件加速器,这些芯片专为分子动力学模拟中的核心计算任务(如牛顿方程求解、长距离力计算)进行深度优化,显著提升了计算效率。
  • 大规模并行计算:以“安腾超级计算机”为例,其设计为大规模并行架构,包含数千个独立计算节点,每个节点内含多个定制加速器。节点间通过高效的通信网络实现数据同步与协同计算,确保大规模模拟任务能够高效并行执行。
  • 大规模高速缓存与流水线化数据流: 每个加速器配备大容量本地缓存,减少对外部内存的频繁访问,提高计算带宽。

软件层面

  • 专用软件:专用超级计算机在软件层面有不同的配置。以“安腾超级计算机”为例,其配套开发了专用的分子动力学模拟软件,与硬件紧密耦合,提供简洁易用的用户接口。该软件支持大规模模拟任务的快速设置、运行与结果分析,确保用户能够便捷地利用“安腾”的强大计算能力进行研发工作。

推荐阅读


生物计算领域,为什么超算安腾比通用超级计算机算得还要快?

点赞(3)
暂无评论

发表评论 取消回复

微信公众账号

微信扫一扫加关注

返回
顶部