站长之家 - 业界 2021-11-09T18:22:35 +08:00

570亿晶体管:英伟达推出新一代InfiniBand平台Quantum-2

GTC 2021 大会期间,英伟达发布了全新的 InfiniBand 网络平台,它就是基于 Bluefield-3 DPU 和 Quantum-2 Infiniband 交换机的 Quantum-2 。官方新闻稿称,其旨在为云计算提供商和超算中心带来极致性能、广泛的可访问性、以及强大的安全性。

作为有史以来最先进的端到端网络平台,NVIDIA Quantum-2 底层是 400Gbps 的 InfiniBand 网络。

在结合该公司的 Quantum-2 交换机、ConnectX-7 网络适配器、BlueField-3 数据处理单元(DPU),以及所有支持新架构的软件。

Quantum-2 的带来,正值超算中心越来越多地向组织之外的公众开放。与此同时,全球云服务提供商也在为数以百万计的客户提供更多超级计算服务。

功能方面,Quantum-2 能够为各个领域要求苛刻的工作负载提供其所需的关键性能。在晕原生技术的支撑下,它可达成 400 Gb/s 的高性能与先进的多租户功能。

英伟达网络高级副总裁 Gilad Shainer 表示:当今超算中心与公共云的需求正在融合,所以必须为下一代高性能计算、人工智能、数据分析等挑战提供尽可能到的性能,同时必须安全地隔离工作负载并响应用户流量的不同需求。

好消息是,在 NVIDIA Quantum-2 InfiniBand 的加持下,现代数据中心的这一愿景现在成为现实。

得益于 400Gbps 的速率,Quantum-2 InfiniBand 不仅让速度加倍、端口数量增加三倍,还可将性能提升 3 倍、让数据中心结构交换机的需求减少至 1/6,同时降低数据中心功耗、以及让空间占用减少 7% 。

此外 Quantum-2 的多租户性能隔离,可防止一个租户的活动干扰到其他租户。利用具有云原生功能、先进的基于遥测的拥塞控制系统,还可确保用户 / 工作负载需求激增情况下的可靠吞吐量。

与上一代相比,Quantum-2 SHARPv3 网络计算技术为 AI 应用程序带来了 32 倍的加速引擎,而 UFM Cyber-AI 平台支持数据中心的高级 InfiniBand 结构管理(包括预测性维护)。

此外集成的 ns 精度计时系统,可为分布式应用程序(比如数据库处理)带来更好的同步支持,有助于减少等待和空间时间开销。而且新功能允许云数据中心成为电信网络的一部分,并托管软件定义的 5G 无线服务。

规格方面,Quantum-2 平台的核心是全新的 Quantum-2 InfiniBand 交换机。其采用了 7nm 制程工艺,在硅片上容纳了 570 亿个晶体管,规模较 540 亿个晶体管的 NVIDIA A100 GPU 还要庞大。

辅以 64 个 400Gbps 端口、或 128 个 200Gbps 端口的灵活搭配,能够在各种交换机系统中提供多达 2048 个 400 Gbps / 4096 个 200 Gbps 端口的扩展能力,是上一代 Quantum-1 平台的 5 倍以上。

结合网络速度、交换能力和可扩展性,Quantum-2 非常适合构建下一代巨型高性能计算(HPC)系统。

感兴趣的客户,能够通过全球广泛的领先基础设施 / 系统供应商订购 Quantum-2,包括 Atos、DataDirect Networks(DDN)、戴尔、Excelero、GIGABYTE、惠与、IBM、浪潮、联想、NEC、Penguin Computing、QCT、超微(Supermicro)、VAST Data、以及 WekaIO 。

最后,NVIDIA Quantum-2 平台提供两个网络端点选项,分别是 ConnectX-7 NIC 和 BlueField-3 DPU InfiniBand 。

前者采用 7nm 设计,拥有 80 亿个晶体管,速率是目前业内领先的 HPC 网络芯片 NVIDIA ConnectX-6 的一倍,RDMA、GPUDirect Storage / RDMA 和网络内计算(In-Networking Computing)的性能也翻倍,预计出样时间为 2022 年 1 月。

后者同样基于 7nm 设计,具有 220 亿个晶体管,辅以 16 个 @ 64-bit 的 ARM CPU 核心来帮助卸载和隔离数据,预计出样时间为 2022 年 5 月。

推荐关键词

24小时热搜

查看更多内容

大家正在看