站长之家(ChinaZ.com) 7月24日消息:Cerberas 和 G42 推出了 4 Exaflops Condor Galaxy 1 AI 超级计算机,其中包含数千个 AMD EPYC 处理器单元和数百万个 AI 核心。
图片来自Cerebras
Cerebras 和 G42 合作,将开创云计算和生成式人工智能领域的新局面。两家公司将共同开发九种不同的超级计算机,其中最引人注目的是 CG-1(Condor Galaxy 1),预计将拥有全球第一的 4 ExaFLOPS 计算能力。
Condor Galaxy 1 AI 超级计算机规格:
- 在 FP16 上实现 4 exaFLOPS 的稀疏 AI 计算
- 5400 万个 AI 优化计算核心
- 82 TB 内存
- 64 个 Cerebras CS-2 系统
- 基本配置支持 6000 亿个参数,可扩展至 100 万亿个。
- 386 TB内部集群结构带宽
- 72,704 个 AMD EPYC 第 3 代处理器内核
- 本机硬件支持 50,000 个令牌序列长度的训练,无需第三方库。
- 具有线性性能扩展的数据并行编程模型
也许你第一次听说这两家公司,但它们都长期以来一直在从事技术开发。Cerebras Systems 以其在生成式人工智能领域的努力而闻名,主要通过其 CS-2 Wafer Scale Engine 实现了 2.6 万亿个晶体管的惊人里程碑。该芯片被称为有史以来最大的芯片,被称为「单个 CS-2 系统,类似于一个超级计算机」。
然而,Cerebras 与 G42 合作,通过他们的新型超级计算机向前迈出了一步。两家公司已经公布了关于 CG-1 的细节,预计它将在行业中树立新的标杆。根据博客文章,CG-1 与 64 台 Cerebras CS-2 系统相连,将它们合并成一个单一的超级计算机,总计计算能力为 4 ExaFLOPS。
当前活跃的超级计算机中,由 AMD 驱动的 Frontier 据说配备了 1.1 ExaFLOPS。CG-1 几乎是其四倍,这在超级计算机行业是一个庞大的数字。Cerebras 的首席执行官 Andrew Feldman 对此表示:
以 FP16 提供 4 ExaFLOPS 的 AI 计算,CG-1 大大缩短了 AI 训练时间,同时消除了分布式计算的痛苦。
许多云公司宣布了庞大的 GPU 集群,花费数十亿美元进行构建,但使用起来非常困难。在数千个小型 GPU 上分布单个模型需要几个月的时间,需要数十名专业人员进行操作。CG-1 消除了这一挑战。
深入了解 CG-1 超级计算机的规格,它具有 4 ExaFLOPS 的 16 位计算能力,以及 6000 亿个参数模型。据称,系统配备了 5400 万个 AI 优化计算核心,每秒 388 TB 的互连带宽和 72,704 个 AMD EPYC CPU 核心。这款设备与我们之前见过的任何产品都不同,根据公开的数据,CG-1 准备在行业中占据主导地位。
Cerebras 和 G42 的雄心并未止步于此,该公司计划互连三台超级计算机(CG-1. CG-2 和 CG-3),目标是达到 12 ExaFLOPS,这是一个巨大的里程碑。此外,该公司计划在 2024 年推出六台超级计算机,总计计算能力将达到 36 ExaFLOPS。这些披露的雄心壮志是巨大的,这可能会开启云计算和生成式人工智能行业的新时代。