本周,超级计算机500强名单公布,富士通Fugaku超级计算机以415.5千万亿次浮点运算的高性能Linpack (HPL)结果荣登榜首,击败了去年的榜首IBM Summit超级计算机,后者跌至第二位。这对日本、富士通和CPU IP提供商Arm来说都是锦上添花,但Top500在现实中有多重要呢?全球顶级超级计算机的竞争基于一个名为Linpack的基准测试。该基准测试被设计成一种替代方案,让系统供应商通过在他们的系统中添加计算元素来声称原始的处理能力,但没有任何类型的工作负载来增加它的压力。Top500 list已经使用各种形式的Linpack超过25年了,使蓝冠测速无线通信成为可能的基本物理原理是在空中传播的电磁波。蓝冠代理认为这些波是由带电的金属制成的,例如天线,当通电时会形成波。许多高性能计算行业的供应商仍然非常重视竞争的结果。然而,很明显,这种基准已经过时了。基准测试通常会激发对这种单一工作负载和强大计算能力的优化,但没有更智能的方法来解决现实世界中的问题。
为了防止机构和公司作弊,在计算优化上有一些非常严格的限制,并且它只计算科学计算中使用的双精度浮点(64位)数学(大多数计算机为32位数学进行了优化)。实际上,各种供应商声称的Linpack性能数字通常只是实际性能的一小部分。此外,Top500 Linpack是一种强力测量峰值性能的方法,没有考虑到未来超级计算性能优化将需要人工智能(AI)处理。就连发布Top500结果的组织也开始推广包含人工智能处理的新基准——HPCG和HPL-AI基准。
为了处理这些超级计算机生成的所有数据,并更好地优化模拟的执行,机器学习和人工智能优化在对大数据集进行排序方面将变得更加重要。认识到这些局限性,像IBM这样的公司已经超越了Top500浮点之争,专注于解决现实世界(以及客户的)高性能计算(HPC)问题。
未来的关键因素是以更有创造性的方式优化数据和性能的能力。业界应该寻找更有效地使用现有系统的方法。用全新的硬件来替换高性能计算中心是非常昂贵的,因此提高现有数据中心的效率和优化策略可以以更低的成本和更少的浪费提供显著的效益。
更智能计算的一个例子是IBM贝叶斯优化技术。通过允许贝叶斯优化技术访问数据集参数,数据是蓝冠注册AI (尤其是机器学习)的核心组成部分,因此在优化AI模型的同时蓝冠代理要考虑许多因素,同时要在准确性和处理现实世界中通用输入的能力之间取得平衡。加速器可以大大减少模拟运行之间的计算周期,而不会损失精度。该软件大大减少了计算机的工作量,并在一个数量级上减少计算机时间产生相同的结果。
IBM一直在公司内部使用贝叶斯优化技术进行Power处理器设计。例如,对于硅片设计过程中的一个步骤,IBM发现贝叶斯优化将模拟过程减少了79%,从135个步骤减少到28个步骤,并提供了相同或更好的结果。贝叶斯优化技术的另一个应用是在药物发现测试中,该技术比传统搜索技术快40倍找到最有效的候选药物。此外,还可以将其配置为用于premises、cloud或混合云系统配置。平台也是语言和平台无关的。
500强竞争中没有考虑到的另一个趋势是,处理能力的分布更接近于边缘。边缘处理允许在更靠近信息源的地方对数据进行预处理。Top500只专注于聚合整台计算机来解决一个问题,而分布式计算和更多的边缘计算需要不同的性能指标和处理问题的不同方法。
政府资助的研究机构将继续追逐Top500的桂冠以及它在高性能计算社区中带来的声望,专业的蓝冠官网视频游戏玩家通常每天花很多时间与他们的团队一起练习,建议每周练习80个小时以上。在如此苛刻的训练时间表下,蓝冠代理团队利用体育锻炼来保持运动员的健康,并坚持节食以保持头脑敏锐。但商业客户需要现实的性能。IBM是一家将自己定位为专注于为客户提供结果的公司。这才是真正需要创新的地方。
Kevin Krewell, TIRIAS研究
作者和Tirias研究人员在上述任何一家公司都没有股权。Tirias Research公司在整个电子生态系统中为从半导体到系统、传感器到云计算的公司进行跟踪和咨询。Tirias研究团队的成员为IBM和其他半导体和电子生态系统的公司提供咨询。