新经网logo.png新经网

新经网
新经网是百姓城市生活中不可缺少的信息港。
新经网

互联新闻:英伟达AmpereA100GPU打破16条AI世界纪录比VoltaV100快4.2倍

导读 科技、数码、互联网新闻如今都成为了大众所关注的热点了,因为在我们的生活当中如今已经是处处与这些相关了,不论是手机也好,电脑也好,

科技、数码、互联网新闻如今都成为了大众所关注的热点了,因为在我们的生活当中如今已经是处处与这些相关了,不论是手机也好,电脑也好,又或者是智能手表也好,与之都相关,那么今天小编也是为大家来推荐一篇关于互联网科技数码方向的文章,希望大家会喜欢哦。

NVIDIA刚刚发布了其AmpereA100GPU的第一个实际性能数据,结果令人疯狂。该公司在AI特定基准测试中总共打破了16条性能记录,并且在特定的机器学习性能类别中击败了其主要竞争对手,取得了巨大的领先优势。

结果来自MLPerf.MLPerf是一家成立于2018年的行业基准测试组,主要专注于机器学习性能。该基准套件包括总共八项测试,并且NVIDIA已以创纪录的培训速度发布了所有记录。

这是NVIDIA在2018年5月成立的行业基准测试组织MLPerf进行的培训测试中连续第三次,也是最强劲的表现。NVIDIA在2018年12月的首个MLPerf培训基准中创下了六项记录,在2019年7月创下了八项记录。

NVIDIA是唯一一家为所有测试提供商用产品的公司。大多数其他提交使用的预览类别是可能几个月不可用的产品,而研究类别是使用预期时间不会可用的产品的。

NVIDIA博客

NVIDIA还报告了其DGXSuperPOD系统的八项新记录,该系统是通过HDRInfiniBand连接在一起的庞大的DGXA100HPC系统集群。DGXSuperPod由140个DGXA100系统组成,总共有1,120个NVIDIAAmpereA100GPU,170个MellanoxQuantum200GInfiniband交换机,4PB的存储空间和15公里的光缆。

令人赞叹的DGXSuperPod系统中大约有770万个AmpereCUDA内核。该系统是DGXV扩展计划的一部分,为该系统增加了近700Petaflops的计算能力,该系统目前已部署在加利福尼亚州圣克拉拉市的NVIDIA总部。

人工智能性能基准-安培vs伏特&更多

NVIDIA已将其AmpereA100TensorCoreGPU加速器与其前身VoltaV100进行了比较。比较还包括Google的第三代TPU和华为的AscendHPC芯片。MLPerf本身列出了更详细的基准测试,还预览了即将推出的AI加速器,例如英特尔的CooperLake-SPXeonCPU和Google的第四代TPU。话虽如此,让我们看一下基准测试本身。

根据MLPerf的说法,他们的基准套件包括针对机器学习和AI类别中最相关的性能工作负载的测试。NVIDIAAmpereA100只是将VoltaV100毁坏,而性能却提高了2.5倍。即使以最低的领先优势,AmpeleA100仍比VoltaV100GPU提升了50%,令人印象深刻。此处的芯片规模已标准化为单个GPU,以便在Ampere和Volta之间进行合理的比较。

华为Ascend芯片只能及时完成一项测试,而且性能也比VoltaV100差,而Google的TPUV3只能及时完成两项测试。在一项测试中,该芯片比NVIDIAVoltaV100领先20%,而在第二项测试中,它比V100慢10%。

与CooperLake-SP8插槽配置可在1104.53分钟内完成图像分类测试相比,双NVIDIAA100系统仅需33.37分钟即可完成同一测试。NVIDIA还继续将其AmpereA100的性能与尚未发布的GoogleTPUV4进行比较,GoogleTPUV4仍处于研究阶段,并且距离上市至少一年。

NVIDIA还展示了其GPU加速器的性能如何随着AI的最新全栈创新而不断提高。与在VoltaV100上运行的MLPerf0.5相比,与AmpereA100一起运行的MLPerf0.7套件提供了惊人的4.2倍性能提升。

这证明了NVIDIAAmpereA100GPU的芯片在AI社区中所有主要玩家认可的套件中的真实基准中的表现令人印象深刻。即使与TuringGPU相比,AmpeleA100GPU也被认为是另一个基准测试中最快的GPU,图灵GPU的硬件加速技术能够提供更好的性能,但仍然无法与AmpereA100及其强大的性能输出相提并论。所有这些基准功能使我们更加高兴地看到以消费者形式的安培,这肯定会在几个月后发生。

相关推荐



最新文章