NVIDIA创办人兼执行长黄仁勋在GTC 22春季展开幕演说中,发表了次世代采用全新Hopper架构的H100 GPU,并推出、更新众多软件与API,为AI运算注入庞大动能。
全新硬件蓄势待发
在开幕演说中,黄仁勋表示身为加速运算的先驱,NVIDIA将运算堆栈(Computing Stack)分为硬件、系统软件、平台软件和应用程序等4个层次,并推出对应的产品。
在最底层的硬件部分,GTC 22最重要的信息末过于采用全新Hopper架构的H100 GPU,以及它极具弹性的多元配置,H100不但具有较前代A100 GPU更高的运算效能(例如在人工智能处理方面,H100的FP8数据类型的效能为A100 FP16的6 倍),而且全新的Transformer Engine、 DPX指令等软件层面的功能也能大幅提升执行效率,让原先需要数周的AI运算工作时间能够降低至短短几天,大幅节省企业营运的成本并提升效率。
更多关于Hopper架构与H100 GPU的详细信息,请参考《NVIDIA于GTC 2022发表全新Hopper GPU架构,还可与Grace合体变身超级芯片》一文。
NVIDIA也于GTC 22发表了多样服务器、网络交换器等硬件产品,其中比较值得关注的重点之一就是专为数字孪生设计的OVX电脑。
传统数据中心在运作时侵向以最短时间处理数据,而非精确时间,但是对于数字孪生而言,其模拟涉及在同一空间、时间内互动的多套自主系统,因此对应的软件和计算机需要能够扩充、低延迟,并支持精确时间,因此有必要建立同步数据中心。
这次发布的第一代NVIDIA OVX Omniverse电脑由8个NVIDIA A40 RTX GPU、3 张 CX6 200 Gbps NIC以及2个Intel Ice Lake中央处理器组成,并搭配NVIDIA Spectrum-3 200 Gbps交换器,能够连接32台OVX电脑组成OVX SuperPOD。 其中最重要的部分为网络与计算机使用精确时间协议(Precision Timing Protocol)进行同步,并采用远程直接内存存取(RDMA)尽量减少封包传输延迟,以满足数字孪生应用需求。
▲I am AI展示视频与AI萌娘在GTC 22春季展又经强化,读者不妨与先前版本比较一下。 (完整演说重播请点我)
▲ 采用Hopper架构的H100 GPU绝对是这场演说的最大亮点。
▲ 专为数字孪生设计的第一代NVIDIA OVX Omniverse电脑由8个NVIDIA A40 RTX GPU、3 张 CX6 200 Gbps NIC以及2个Intel Ice Lake中央处理器组成。
▲ OVX SuperPOD通过NVIDIA Spectrum-3 200 Gbps交换器串接32台OVX电脑组成。
软件方面也有提升
黄仁勋也在演说中提到,除了4大层面之外,百万倍运算加速、Transformer Engine加速人工智能发展、数据中心成为人工智能工厂、对机器人系统的需求大幅上升,以及新一代人工智能的数字孪生等5大动力,也将成为人工智能发展的趋势。
NVIDIA也提出许多如Hyperion 9自驾车平台、DRIVE Map、Omniverse Cloud、Clara Holoscan MGX、Jetson AGX Orin等软件、硬件、服务等多样产品,笔者将会于于日后陆续更新精选报道。
▲ 百万倍运算加速、Transformer Engine、人工智能工厂、机器人系统、数字孪生等5大动力将成为人工智能发展的趋势。
目前GTC22正在进行中,错过开幕演说的读者可以在此观赏完整重播,更多关于GTC22的报道请点此链接。