站长之家 - 业界 2022-05-04 17:00

白皮书揭示了英伟达Hopper大芯片的关键规格

为英伟达下一代 H100 加速卡提供支撑的 GH100 芯片,纸面规格已经让人感到十分惊讶。不过周末曝光的白皮书,又让我们对其有了更深入的了解。据悉,绿厂正在积极利用台积电的 N4(4nm 级 EUV)先进工艺来构建 Hopper GPU,而 H100 大芯片更是被六个 HBM3 高带宽显存堆栈给环绕着。

1.jpg

(图 via ComputerBase.de)

TechPowerUp 指出:GH100 计算芯片拥有 800 亿个庞大的晶体管数量,较 GA100 增加近 50% 。

2.png

Hopper GPU 的流处理器设计

有趣的是,在 4nm EUV 工艺的加持下,GH100 的芯片面积却只有 814 m㎡,小于基于 7nm DUV(台积电 N7 工艺)节点制造的 GA100(826 m㎡)。

3.png

Ampere GPU 的流处理器设计

由图可知,英伟达 GH100 的组件层次结构与上一代类似,主要数学运算部分被布置到了 144 组流处理器(SM)上。

GH100 拥有 18432 个 FP32(单精度)/ 9216 个 FP64 (双精度)CUDA 核心,辅以 576 个第四代 Tensor 核心,此外硅片上其中一组 GPC 具有光栅图形单元。

4.png

鉴于 GH100 具有 6144-bit 的 HBM3 显存位宽,英伟达或为其标配 80GB VRAM,预计带宽可超 3 TB/s(且有 ECC 加持)。

主机接口也迎来了重大升级,且 SXM 外形的 PCB 板上配备了最新一代 NVLink 界面(具有 900 GB/s 的带宽)。

5.png

AIC 插卡版本则是采用了 PCIe 5.0 x16(128 GB/s)接口,且两者都引入了资源池(resource-pooling)功能。

最后,英伟达正在用更高的功耗来压榨更多的性能 —— 可知 H100 的典型功率值为 700W,而 A100 仅为 400W 。

6.jpg

不过 H100 并非满血 SKU,即使高密度的 SXM 外形版本,也只启用了 144 组 SM 单元中的 132 个 。

PCIe 插卡版本更是仅启用了 114 个 SM 单元,且两者的最高时钟速率都是 1.80 GHz 。

推荐关键词

24小时热搜

查看更多内容

大家正在看