GTC 22春季展开幕演说，NVIDIA发布全新Hopper架构GPU，并更新超过60款API

cnBeta • 2023年9月27日 13:09 • 投稿

NVIDIA创办人兼执行长黄仁勋在GTC 22春季展开幕演说中，发表了次世代采用全新Hopper架构的H100 GPU，并推出、更新众多软件与API，为AI运算注入庞大动能。

全新硬件蓄势待发

在开幕演说中，黄仁勋表示身为加速运算的先驱，NVIDIA将运算堆栈（Computing Stack）分为硬件、系统软件、平台软件和应用程序等4个层次，并推出对应的产品。

在最底层的硬件部分，GTC 22最重要的信息末过于采用全新Hopper架构的H100 GPU，以及它极具弹性的多元配置，H100不但具有较前代A100 GPU更高的运算效能（例如在人工智能处理方面，H100的FP8数据类型的效能为A100 FP16的6 倍），而且全新的Transformer Engine、 DPX指令等软件层面的功能也能大幅提升执行效率，让原先需要数周的AI运算工作时间能够降低至短短几天，大幅节省企业营运的成本并提升效率。

更多关于Hopper架构与H100 GPU的详细信息，请参考《NVIDIA于GTC 2022发表全新Hopper GPU架构，还可与Grace合体变身超级芯片》一文。

NVIDIA也于GTC 22发表了多样服务器、网络交换器等硬件产品，其中比较值得关注的重点之一就是专为数字孪生设计的OVX电脑。

传统数据中心在运作时侵向以最短时间处理数据，而非精确时间，但是对于数字孪生而言，其模拟涉及在同一空间、时间内互动的多套自主系统，因此对应的软件和计算机需要能够扩充、低延迟，并支持精确时间，因此有必要建立同步数据中心。

这次发布的第一代NVIDIA OVX Omniverse电脑由8个NVIDIA A40 RTX GPU、3 张 CX6 200 Gbps NIC以及2个Intel Ice Lake中央处理器组成，并搭配NVIDIA Spectrum-3 200 Gbps交换器，能够连接32台OVX电脑组成OVX SuperPOD。其中最重要的部分为网络与计算机使用精确时间协议（Precision Timing Protocol）进行同步，并采用远程直接内存存取（RDMA）尽量减少封包传输延迟，以满足数字孪生应用需求。

▲I am AI展示视频与AI萌娘在GTC 22春季展又经强化，读者不妨与先前版本比较一下。（完整演说重播请点我）

▲ 采用Hopper架构的H100 GPU绝对是这场演说的最大亮点。