站长之家 - 业界 2021-04-13 09:13

英伟达发布基于Ampere架构的A10/A30 Tensor Core GPU

在今日的活动上,英伟达发布了与 CPU 和 GPU 相关的诸多公告,其中就包括了面向数据中心市场、主打虚拟化平台、且基于 Ampere 架构的 A10/ A30Tensor Core GPU 。两款产品分别基于 GA102/ GA100GPU 核心,辅以24GB 的 GDDR6/ HBM2显存。

首先介绍下 Nvidia A10Tensor Core GPU,其基于 GA102-890SKU,拥有72组 SM 单元 /9216个 CUDA 核心。

基础频率855MHz / 加速可达1695MHz,辅以384-bit @24GB GDDR6显存(频率12.5Gbps)、带宽600GB/s,并且兼容 PCIe4.0。

计算卡本体采用了单槽全长尺寸,辅以被动式散热设计的香槟金色外壳(无风扇),热设计功耗(TDP)150W,通过单8-pin 外接供电。

性能方面,该卡最高可达31.2TF FP32、62.5TF TF32、125TF BFLOAT16、250TOPS INT8、500TOPS INT4、以及两倍的稀疏性(sparsity)。

其次是 Nvidia A30Tensor Core GPU,其基于 GA100SKU(尚不清楚确切的衍生版本)。

基础频率930MHz / 加速可达1440MHz,辅以24GB HBM2显存(3072-bit @1215MHz),带宽高达933GB/s 。

与 A10不同的是,A30采用了双槽全长设计,TDP 高达165W,但仍可通过单8-pin 外接供电。

性能方面,该卡最高可达5.2TF FP64、10.3TF Peak FP64TF、10.3TF FP32、82TF TF32、165TF BFLOAT16、330TOPS INT8、661TOPS INT4、以及两倍的稀疏性。

合作伙伴之一的浪潮,亦推出了 NF5468M6/ NF5468A5/ NF5280M6三条服务器产品线。

其中 NF5468M6 主打超灵活的 AI 工作负载,支持双路英特尔第三代至强可扩展处理器,8张英伟达 A100/ A40/ A30GPU、16张 A10GPU、或20张 T4GPU 。

在4U 机箱中,最多可配备12块3.5英寸硬盘驱动器,可灵活适应最新的 AI 加速器 / 智能 NIC,辅以一键式切换拓补等功能,适用于 AI 云、智能视频分析(IVA)、视频处理等各种人工智能应用程序。

NF5468A5 多功能 AI 服务器,其支持双路 AMD Rome / Milan CPU 和8张英伟达 A100/ A40/ A30GPU,辅以 N + N 冗余设计。

在全速运行时可调用8块350W 的 AI 加速卡,能够带来出色的性能与可靠性。此外 CPU 与 GPU 之间的非阻塞设计,允许它在不经由 PCIe 交换芯片的情况下实现互连通信,以实现更快的计算效率。

NF5280M6 则是专为所有场景而打造的2U 产品,支持双路英特尔第三代至强可扩展处理器,4张英伟达 A100/ A40/ A30/ A10GPU 或8张 T4Tensor Core GPU,可在45℃ 下长期稳定运行。

该计算卡配备了最新的 PFR / SGX 技术和可信赖的安全模块设计,适用于要求苛刻的各种 AI 应用。

浪潮还宣布了全新的 M6AI 服务器,将英伟达 Bluefield-2DPU 完全集成到了该公司的下一代 AI 服务器中。

可为人工智能、大数据分析、云计算等场景,提供更快、更高效的用户 / 集群管理,以及互连数据的访问 / 虚拟化。

目前全球制造商已经提供了20多套经过英伟达认证的系统,预计各大制造商配备 A30/ A10GPU 的新产品将于今年晚些时候上市。

最后,Nvidia AI Enterprise 采用了永久授权模式,单路 CPU 插槽的报价为3595美元,此外企业标准业务支持的年费为899美元。

感兴趣的客户,亦可在计划升级到 VMware vSphere7Update2的时候,申请 NVIDIA AI Enterprise 的早期访问。

推荐关键词

24小时热搜

查看更多内容

大家正在看