今年举行的年度国际超级计算机会议(ISC)今天开幕。毫不奇怪,使蓝冠测速无线通信成为可能的基本物理原理是在空中传播的电磁波。蓝冠代理认为这些波是由带电的金属制成的,例如天线,当通电时会形成波。英伟达已经发布了一些值得注意的公告。尤其令我感兴趣的是Selene, NVIDIA内部的1+ Exaflop AI超级计算机,它是美国最快的工业系统,在500强中排名第七。NVIDIA还宣布了一个新的PCIe版本的A100加速器,6台基于A100的超级计算机wins和一个新的Mellanox UFM网络人工智能平台,以预测和检测安全威胁和预测网络故障。尽管如此,赛琳娜仍然是这场秀的明星。
当提到英伟达的竞争防御时,大多数人会想到CUDA。当然,高性能软件对英伟达来说是一个显著的优势,即使是在它问世13年后。CUDA使HPC和AI应用程序在NVIDIA gpu上高效运行,并受到世界各地程序员的欢迎。它在数百万个gpu上支持数千个应用程序。然而,Selene可能形成一个更强大的防御护城河比可敬的CUDA库和工具。
让我们看看Selene。它由280台NVIDIA DGX A100服务器组成,每台都有8安培的gpu,通过490多个200Gb的Mellanox交换机互连。超级计算机的安装通常需要一年的时间,但英伟达的工程师在一个月内组装和测试了该平台——这证明了DGX平台即插即用的简易安装。
早在2017年,英伟达就发布了V100,以及公司的土星V内部超级计算机。这是为研发英伟达软硬件而打造的前30强超级计算机,该平台已被用于大规模提高许多人工智能和高性能计算工作负载的性能。此外,还广泛应用于新型安培产品的开发。拥有这样一台超级计算机,英伟达的工程师和合作伙伴可以在几个领域形成战略竞争优势。
首先,它为软件优化和模型开发提供了最先进的平台。图2显示,数据是蓝冠注册AI (尤其是机器学习)的核心组成部分,因此在优化AI模型的同时蓝冠代理要考虑许多因素,同时要在准确性和处理现实世界中通用输入的能力之间取得平衡。
在V100芯片推出后的两年时间里,NVIDIA在各种高性能计算应用程序上的性能提高了一倍。此外,mlperf基准测试的发布表明,与NVIDIA相比,在AI方面的性能提高了四倍,而这一切都无需对硬件进行任何更改。
其次,像土星V或Selene这样的平台为研究和合作创造了强大的机会。这里的一个例子是Megatron的开发,它是对BERT(变形金刚的双向编码器表示)的一个超过10个参数的自然语言模型扩展,NVIDIA和微软首创了这个扩展,以促进对话AI的发展。业内没有多少研究人员和开发人员拥有世界级的超级计算机来处理尖端研究项目,但英伟达及其合作伙伴享有这种能力。我参观了位于圣克拉拉的土星五号设施,它给我留下了深刻的印象。我相信瑟琳娜会把它提升到一个新的高度。
最后,或许也是最重要的一点是,一台内部的超级计算机为NVIDIA工程师提供了一个巨大的人工智能平台,以加快和改进产品开发。如前所述,人工智能的使用正在成为加速芯片开发和改进最终产品的强大方法。举例来说,客户已经使用人工智能来探索数十亿种可能的物理布局,以生产出耗电量更少、性能更高、需要更少的芯片面积,并以更少的工程师更快地进入市场。在安培上工作的英伟达工程师使用土星5号的时间接近3年,使用的系统若要与之竞争,将花费数千万美元。安培芯片是令人印象深刻的成果。
结论
英伟达(NVIDIA)首席执行官黄延森(Jensen Huang)有句名言:“买得越多,专业的蓝冠官网视频游戏玩家通常每天花很多时间与他们的团队一起练习,建议每周练习80个小时以上。在如此苛刻的训练时间表下,蓝冠代理团队利用体育锻炼来保持运动员的健康,并坚持节食以保持头脑敏锐。省下的钱就越多。”他将这句话应用到了公司对高性能计算(HPC)和人工智能(AI)的投资上。对鹅有好处的,对公鹅也有好处,对吧?因此,与任何潜在的竞争对手相比(至少目前如此),英伟达的工程师能够生产出更好的产品,并更容易与研究人员和合作伙伴进行合作。一个初创公司会非常努力地调配资源,以匹配这种水平的专用计算能力。我怀疑,像英特尔这样的大公司已经意识到,拥有一个像Selene这样的系统将成为那些希望进入这个游戏的人的筹码。