NVIDIA 为 Meta 打造大型人工智能研究超级计算机

NVIDIA 为 Meta 打造大型人工智能研究超级计算机

Meta 宣布其人工智能(AI)研究超级计算机 RSC 搭载 NVIDIA DGX A100、网络及 AI 软件,能提供 Meta AI 研究 5 exaflops 的运算能力,以及由 NVIDIA 系统、InfiniBand fabric 及 AI 软件针对跨数千个 GPU 进行最佳化。

Meta希望藉由RES来训练超过一万亿个参数的AI模型,而RES采用760个NVIDIADGXA100系统运算节点,这组合着总共6,080个NVIDIAAA100 GPU,并通过NVIDIA Quantum每秒200Gb连接速度的InfiniBand相连,能够提供每秒1,896次浮点运算(petaFLOPS)的TF32效能。

而Meta在2017年就已经采用22,000个NVIDIA V100 Tensor Core GPU进行每日35,000个AI训练工作,至于RSC的早期性能测试显示,对比旧系统效能在训练大型NLP模型可达到3x倍速度提升,以及20x倍的计算机视觉效能增长。

RSC 该系统于今年稍晚全面部署后,有望成为迄今完成设置的最大 NVIDIA DGX A100 系统。

(0)
打赏 微信扫一扫 微信扫一扫

相关推荐

发表评论

登录后才能评论