Microsoft Azure以 30.05 Petaflops 的成绩加入了TOP500 超级计算机排名的Top 10 俱乐部。它基于 Microsoft 最近宣布的 Azure NDm A100 80GB v4,可按需提供。这些 Azure NDm A100 v4 实例由 NVIDIA GPU 加速和 NVIDIA InfiniBand 网络提供支持。微软今天重点介绍了最新的(2021 年 12 月)MLPerf 1.1 结果,在该结果中,Azure 的总体性能排名第二,云提供商排名第一。- 在 2,048 个 GPU 上训练 BERT 大型自然语言处理模型大约需要 25 秒
- 使用 Resnet50 1.5 图像分类和 2,048 个 GPU 每秒处理多达 380 万张图像
- 使用 1,792 个 GPU 在不到 17.5 分钟的时间内完成了 Minigo(强化学习)基准测试。
上述结果展示了 Azure 对使用云计算进行 AI 培训的规模和性能的承诺。
最新的 MLPerf Training v1.1 基准测试轮收到了 14 个组织的提交,并发布了超过 185 个同行评审结果,用于从边缘设备到数据中心服务器的机器学习系统。本轮提交的软件和硬件创新包括来自 Azure、百度、戴尔、富士通、技嘉、谷歌、Graphcore、HabanaLabs、HPE、浪潮、联想、英伟达、三星和 Supermicro。您可以在此处找到完整的结果。