GTC 22春季展开幕演说,NVIDIA发布全新Hopper架构GPU,并更新超过60款API

GTC 22春季展开幕演说,NVIDIA发布全新Hopper架构GPU,并更新超过60款API

NVIDIA创办人兼执行长黄仁勋在GTC 22春季展开幕演说中,发表了次世代采用全新Hopper架构的H100 GPU,并推出、更新众多软件与API,为AI运算注入庞大动能。

全新硬件蓄势待发

在开幕演说中,黄仁勋表示身为加速运算的先驱,NVIDIA将运算堆栈(Computing Stack)分为硬件、系统软件、平台软件和应用程序等4个层次,并推出对应的产品。

在最底层的硬件部分,GTC 22最重要的信息末过于采用全新Hopper架构的H100 GPU,以及它极具弹性的多元配置,H100不但具有较前代A100 GPU更高的运算效能(例如在人工智能处理方面,H100的FP8数据类型的效能为A100 FP16的6 倍),而且全新的Transformer Engine、 DPX指令等软件层面的功能也能大幅提升执行效率,让原先需要数周的AI运算工作时间能够降低至短短几天,大幅节省企业营运的成本并提升效率。

更多关于Hopper架构与H100 GPU的详细信息,请参考《NVIDIA于GTC 2022发表全新Hopper GPU架构,还可与Grace合体变身超级芯片》一文。

NVIDIA也于GTC 22发表了多样服务器、网络交换器等硬件产品,其中比较值得关注的重点之一就是专为数字孪生设计的OVX电脑。

传统数据中心在运作时侵向以最短时间处理数据,而非精确时间,但是对于数字孪生而言,其模拟涉及在同一空间、时间内互动的多套自主系统,因此对应的软件和计算机需要能够扩充、低延迟,并支持精确时间,因此有必要建立同步数据中心。

这次发布的第一代NVIDIA OVX Omniverse电脑由8个NVIDIA A40 RTX GPU、3 张 CX6 200 Gbps NIC以及2个Intel Ice Lake中央处理器组成,并搭配NVIDIA Spectrum-3 200 Gbps交换器,能够连接32台OVX电脑组成OVX SuperPOD。 其中最重要的部分为网络与计算机使用精确时间协议(Precision Timing Protocol)进行同步,并采用远程直接内存存取(RDMA)尽量减少封包传输延迟,以满足数字孪生应用需求。

▲I am AI展示视频与AI萌娘在GTC 22春季展又经强化,读者不妨与先前版本比较一下。 (完整演说重播请点我)

采用Hopper架构的H100 GPU绝对是这场演说的最大亮点。▲ 采用Hopper架构的H100 GPU绝对是这场演说的最大亮点。

专为数字孪生设计的第一代NVIDIA OVX Omniverse电脑由8个NVIDIA A40 RTX GPU、3 张 CX6 200 Gbps NIC以及2个Intel Ice Lake中央处理器组成。▲ 专为数字孪生设计的第一代NVIDIA OVX Omniverse电脑由8个NVIDIA A40 RTX GPU、3 张 CX6 200 Gbps NIC以及2个Intel Ice Lake中央处理器组成。

OVX SuperPOD通过NVIDIA Spectrum-3 200 Gbps交换器串接32台OVX电脑组成。▲ OVX SuperPOD通过NVIDIA Spectrum-3 200 Gbps交换器串接32台OVX电脑组成。

软件方面也有提升

黄仁勋也在演说中提到,除了4大层面之外,百万倍运算加速、Transformer Engine加速人工智能发展、数据中心成为人工智能工厂、对机器人系统的需求大幅上升,以及新一代人工智能的数字孪生等5大动力,也将成为人工智能发展的趋势。

NVIDIA也提出许多如Hyperion 9自驾车平台、DRIVE Map、Omniverse Cloud、Clara Holoscan MGX、Jetson AGX Orin等软件、硬件、服务等多样产品,笔者将会于于日后陆续更新精选报道。

百万倍运算加速、Transformer Engine、人工智能工厂、机器人系统、数字孪生等5大动力将成为人工智能发展的趋势。▲ 百万倍运算加速、Transformer Engine、人工智能工厂、机器人系统、数字孪生等5大动力将成为人工智能发展的趋势。

目前GTC22正在进行中,错过开幕演说的读者可以在此观赏完整重播,更多关于GTC22的报道请点此链接。

(0)
打赏 微信扫一扫 微信扫一扫

相关推荐

发表评论

登录后才能评论