Hopper架构英伟达H100 GPU登场，采台积电4nm制程

游研社 • 2023年9月29日 09:42 • 投稿

NVIDIA 于 GTC 2022（GPU 技术大会）正式发表以美国计算机科学家先驱 Grace Hopper 命名的 NVIDIA Hopper 架构，以及采用该架构的 NVIDIA H100 GPU，导入 TSMC 台积电 4nm 客制化 4N 制程，搭配 HBM3 内存，接替两年前推出的 NVIDIA Ampere 架构。

NVIDIA 数据中心 GPU 系列规格

产品	完整 GH100 GPU	NVIDIA H100 SXM5	NVIDIA H100 PCIe	NVIDIA A100
芯片代号	GH100	GH100	GH100	GA100
制程	TSMC 4nm	TSMC 4nm	TSMC 4nm	TSMC 7nm
晶圆面积	814 mm^2	814 mm^2	814 mm^2	826 mm^2
晶体管数量	800亿	800亿	800亿	540亿
SM 数量	144	132	114	108
CUDA 核心数	18432	16896	14592	6912
Tensor 核心数	576	528	456	432
L2 快取	60 MB	50 MB	50 MB	40 MB
INT8 Tensor Core 效能	未公布	2000 TeraFLOPS 稀疏 4000 TeraFLOPS	1600 TeraFLOPS 稀疏 3200 TeraFLOPS	624 TeraOPS 稀疏 1248 TeraOPS
FP8 Tensor Core 效能	2000 TeraFLOPS 稀疏 4000 TeraFLOPS	1600 TeraFLOPS 稀疏 3200 TeraFLOPS	N/A
FP16 半精度浮点效能	120 TeraFLOPS	96 TeraFLOPS	78 TeraFLOPS
FP16 Tensor Core 效能	1000 TeraFLOPS 稀疏 2000 TeraFLOPS	800 TeraFLOPS 稀疏 1600 TeraFLOPS	312 TeraFLOPS 稀疏 624 TeraFLOPS
FP32 单精度浮点效能	60 TeraFLOPS	48 TeraFLOPS	19.5 TeraFLOPS
FP32 Tensor Core 效能	500 TeraFLOPS 稀疏 1000 TeraFLOPS	400 TeraFLOPS 稀疏 800 TeraFLOPS	156 TeraFLOPS 稀疏 312 TeraFLOPS
FP64 双精度浮点效能	30 TeraFLOPS	24 TeraFLOPS	9.7 TeraFLOPS
FP64 Tensor Core 效能	60 TeraFLOPS	48 TeraFLOPS	19.5 TeraFLOPS
内存形式	HBM3 / HBM2e	80 GB HBM3	80 GB HBM2e	40GB HBM2e
内存接口	6144-bit	5120-bit	5120-bit	5120-bit
记忆体带宽	未公布	3000 GB/s	2000 GB/s	1555 GB/s
TDP	未公布	700W	350W	400W
封装形式	SXM5 / PCIe 5.0	SXM5	PCIe 5.0	SXM4 / PCIe 4.0