虽然摩尔定律已经终结,但提升计算性能的需求却永无止境。为此,采用传统方法的成本与功耗也将成倍增加。
与此同时,为减缓气候变化所带来的影响,我们需要更加高效的数据中心。全球数据中心每年的能耗已经超过200兆瓦时,占全球总能耗的2%。
最新发布的Green500榜单展现了加速计算的能效。上榜的均是全球最高效的超级计算机,其中排名前30的系统都采用了加速计算。加速计算在能效方面的影响是非常惊人的。
据NVIDIA估计TOP500榜单上的系统每年需要消耗超过5太瓦时或价值7.5亿美元的能源。
但如果TOP500榜单上的系统都能够像Green500榜单上排名前30的系统那样高效,那么这一数字就能削减80%以上,即只需消耗1.5亿美元的能源,足足节省4太瓦时。
反之,以如今TOP500系统的电力预算,如果这些超级计算机都能达到Green500榜单中排名前30的系统的效率,则能够提供5倍于如今的性能。
而最新Green500系统所突显的效率提升还只是冰山一角。NVIDIA正在不断改进其CPU、GPU、软件和系统组合的能耗。
Hopper在Green500榜单上的首次亮相
在最新Green500榜单上排名前30的系统中,有23个采用了NVIDIA的技术。
其中最引人注目的是,纽约市Flatiron研究所的风冷式ThinkSystem位列Green500榜首,它由联想公司制造,搭载了NVIDIA Hopper H100 GPU。
这台超级计算机,又名Henri。根据Green500的数据,Henri每瓦可进行650亿次双精度浮点运算,将被用于解决计算天体物理学、生物学、数学、神经科学和量子物理学领域的问题。
TOP500新上榜单的系统中,速度最快的新计算机是非营利性联盟Cineca管理的Leonardo。该系统采用了近14,000个NVIDIA A100 GPU,在TOP500榜单中位列第4,同时在Green500榜单中也排在第13位。
在TOP500榜单上,共有361个系统采用了NVIDIA技术,而90%的新系统都采用了NVIDIA技术(参见图表)。
最新TOP500榜单上使用NVIDIA技术的系统数量达到历史新高。
新一代加速数据中心
NVIDIA还在开发能够为加速数据中心提供更高能效与性能的新计算架构。
今年早些时候发布的Grace CPU和Grace Hopper超级芯片将进一步大幅提升NVIDIA加速计算平台的能效。凭借Grace CPU和低功耗LPDDR5X内存的惊人效率,Grace CPU超级芯片的每瓦性能最高可达到传统CPU的两倍。
假设一座100万瓦的高性能计算数据中心将20%的电力分配给CPU分区,将80%的电力分配给使用Grace和Grace Hopper的加速分区,则与基于x86、采用类似分区方法的数据中心相比,该数据中心可以在相同的电力预算下完成1.8倍的工作。
DPU进一步提升效率
除了Grace和Grace Hopper,NVIDIA网络技术也大大加快了云原生超级计算的速度。同时,仿真使用量的增加也推动了对超级计算服务的需求。
包含了 NVIDIA BlueField-3 DPU的NVIDIA Quantum-2 InfiniBand平台提供了云计算服务提供商和超级计算中心所需的极高性能、广泛的可用性与强大的安全性。
最近的一份白皮书对此进行了描述,展示了如何使用DPU来卸载和加速网络、安全、存储或其他基础设施功能以及控制平面应用,从而将服务器功耗降低30%。
节省的电量与服务器负载量成正比。一座拥有1万台服务器的大型数据中心在三年的服务器寿命期内,可以轻松节省500万美元的电费,另外还可以节省冷却、输电、机架空间和服务器投资方面的成本。
加速计算结合DPU在网络、安全和存储方面的能力,已成为未来提升数据中心能效的重要一步。
事半功倍
科学研究的方法在迅速转变,通过基于数据分析、人工智能和物理学仿真等方式的驱动,更高效的计算机将能够成为下一代科学突破的关键。
NVIDIA正致力于为研究者提供针对这种全新科学研究方法进行优化的多学科高性能计算平台,同时兼顾性能与效率,助力科学家能够藉此开展造福全人类的重大研究。