Julich超级计算机将有一个“老大哥”,即所谓的升压模块,正如Forschungszentrum Julich、Atos和ParTec所同意的那样。该模块配备了数千个图形处理器,是为极限计算能力和人工智能任务而设计的。它是一个法德合作项目,由英伟达和梅拉诺克斯共同设计。随着2020年助推器的发射,冠蓝在线测速朱维尔的计算能力将从目前的12次浮点运算提高到70次浮点运算。这相当于每秒70万亿次运算,或者超过30万台现代个人电脑的运算能力——目前欧洲没有哪台电脑的运算速度更快。
JUWELS简称为“Julich欧洲领导科学的向导”,它遵循了Julich开发的模块化超级计算体系结构的新原则。这允许不同的模块,根据不同的需求,使用统一的系统软件整合在一起,并相互连接,形成一个单一的、超灵活的超级计算机。
第一个模块,所谓的集群模块,以其通用性和易用性给人留下深刻印象。它于2018年投入使用,从一开始就被设计用于扩展附加模块。到目前为止,这些模块中最大的是即将推出的带有图形处理器的升压模块,它可以用来并行处理大量数据,特别是计算密集型的程序部分,并具有最大的效率——例如用于大规模模拟或机器学习。
当朱维尔的第一个组件被安装后,市场上并没有建造助推器所需的所有组件。现在,一个平衡良好的高性能计算模块所需的所有部件都可以用来构建这个新的扩展。
超级计算机的新概念
Julich超级计算中心(JSC)主任Thomas Lippert教授解释说:“模块化的超级计算架构使灵活地、毫不妥协地整合现有的最佳技术成为可能。”模块化是我们对应用程序代码在超级计算机上提出的日益复杂和异构的要求的回应。它使我们能够以低成本高效率实现百亿亿次的目标,甚至将使我们有可能集成未来的奇异技术,监冠测速如量子计算机。”
百亿亿次计算机的建造正作为高性能计算(HPC)领域的下一个主要步骤在世界范围内进行。这种计算机每秒运算1万亿次(10^18),比当今最快的超级计算机至少强大一个数量级。
模块化超级计算的想法是由Lippert提出的,并在Estela Suarez博士、JSC和ParTec博士的指导下付诸实施。在来自研究和工业的许多欧洲伙伴的帮助下,ParTec和eu资助的研究项目进行了越来越深入的研究。“JUWELS助推器是开发欧洲百亿亿次系统的开创性成果,因为它使欧洲在系统架构领域的领导地位得以发挥作用,”ParTec公司首席执行官Bernhard Frohwitter说。
来自欧洲、以色列和美国的硬件合作伙伴
JUWELS助推器是基于来自Atos的BullSequana XH2000超级计算机系列。BullSequana平台配备了我们最新的最强大的加速叶片,为Julich提供了最有效的计算基础设施,我们正朝着百亿亿次的目标迈进。它还支持Julich的承诺,以我们的专利直接液体冷却温水解决方案,”艾格尼丝·布多说,高级副总裁,高性能计算和量子在Atos的负责人。
模块化JUWELS系统的一个独特之处在于,它同样适用于模拟和机器学习(即人工智能)领域中要求最高的任务,并且可以很容易地将这两个领域结合起来。NVIDIA解决方案架构和工程副总裁Marc Hamilton说:“JSC在JUWELS的升压模块中使用了我们的下一代gpu来满足这些最高能源效率的要求。”
模块化计算机所要求的极高的网络性能来自Mellanox。“我们的200gb /s HDR InfiniBand技术提供世界领先的数据吞吐量和极低的延迟,提供的网络性能与JUWELS助推器的计算节点的处理能力相匹配。此外,灵活的自适应路由和控制能力使JUWELS能够作为一个统一的模块超级计算机运行,蓝冠2测速”Mellanox技术公司营销高级副总裁Gilad Shainer说。