站长之家 - 业界 2022-08-25 11:00

Hot Chips 34:摆脱x86束缚 英伟达详解Grace服务器CPU设计

在 Hot Chips 大会期间,英伟达详细介绍了该公司的 Grace CPU 设计。作为一种经典意义上的中央处理器,其旨在取代英特尔至强(Xeon)/ AMD 霄龙(EPYC)竞品,以在预先构建的高性能计算(HPC)服务器中扮演串行处理的角色 —— 因为每台服务器的六张 GPU 加速卡需要通过 CPU 进行互连。

1.jpg

(via WCCFTech)

据悉,该公司不仅研究了 CPU 层面的 I/O 与机器架构的瓶颈,还意识到了其计算服务器需要专门为这样的应用场景而定制中央处理器。

得益于针对 NVIDIA API 的高度架构优化,Grace CPU 就此应运而生。

作为该公司首款服务器 CPU 产品,其效用可与 Intel / AMD 竞品一较高下。

作为一款单芯片,其采用了台积电 N4(4nm EUV)工艺制造,且英伟达将带有一两颗 Grace CPU + 一颗 H100 的板子称作 Superchip 或 Grace Hopper 超级芯片。

可知每个Grace CPU 包含了一个 900 GB/s 的交换结构,以及一个带宽达到 PCIe 5.0 x16 七倍的 Coherent Interface 接口。

后者也是将相伴的 H100 或节点上相邻的超级芯片、与一致的内存访问连接起来的关键。

2.jpg

Grace CPU 的串行处理能力,由 72 核心的 ARM v9 64-bit CPU 提供,而一枚超级芯片则包含了 144 个核心。

主内存采用了 LPDDR5x 接口(支持 ECC),每个‘插槽’的带宽高达 1 TB/s —— 媲美超过 24 个通道的 DDR5 方案。

此外具有 68 条 PCIe 5.0 扮演了关键的串行 IO 接口角色,其主要被用于连接 NVMe 存储设备,且芯片的标称峰值 TDP 功耗达到了 500W 。

随着 Grace CPU 的亮相,英伟达展示了该公司为企业和 HPC 应用场景设计大型多核处理器方面的强大工程实力。TechPowerUp 指出:

鉴于 ARM 已大幅缩小与 x86-64 平台的性能、效率和 IPC 表现差距,我们也不难理解绿厂为何没能拿到蓝厂的 x86 许可,原本它有望交付出与英特尔相媲美的企业级处理器。

即便如此,英伟达的 DGX 计算节点、以及后续的更多预构建工作站 / 服务器(涵盖众多应用场景),势必将逐渐摆脱传统 x86 CPU、并用 Grace 及其继任者取而代之。

推荐关键词

24小时热搜

查看更多内容

大家正在看

ChatGPT搜索?也就那样