站长之家(ChinaZ.com) 7月21日 消息:据路透社消息,人工智能芯片初创公司Cerebras Systems Inc.与阿布扎比的科技公司Group 42 Holding Ltd.合作,打造了据称是世界上最大的AI训练超级计算机,为企业提供了一种替代英伟达公司制造的系统的选择。
该公司今天宣布,其新系统Condor Galaxy1 的第一阶段已经在加利福尼亚州圣克拉拉投入运行。这台超级计算机据说耗资超过 1 亿美元,将在未来几周内扩大一倍,并于 2024 年在德克萨斯州奥斯汀和北卡罗来纳州阿什维尔增加额外的系统。同年,还将在海外增加其他站点,总数达到九个。
Cerebras Systems表示,Condor Galaxy1 旨在提供训练AI模型和服务所需的巨大计算能力,这已经成为英伟达公司利用其图形处理单元的专长。Cerebras首席执行官Andrew Feldman在接受彭博社采访时表示,这是世界上最大的专为AI设计的计算中心,并提供了一种使用英伟达技术的经济有效的替代方案。
与G42 的合作代表了阿联酋在AI领域的重大推进。G42 专注于将AI应用于医疗、航空等领域的实际用例。
G42 将使用这些超级计算机进行自己的项目,并且两家公司还将以服务的形式向商业客户提供多余的计算能力。
Condor Galaxy1 提供了训练最强大的基础AI模型所需的所有要素,包括巨大的计算能力、庞大的数据集和AI方面的专业知识。Cerebras表示,它通过其机器的惊人原始能力实现了对AI的民主化,这将与G42 提供的涵盖医疗、能源和气候研究等领域的多样化数据集相结合。
这台超级计算机,配合硬件和数据工程师以及AI科学家组成的专家团队,使Cerebras和G42 能够提供一套全方位的AI训练系统,他们称之将与任何基于云的系统相媲美。
随着Condor Galaxy1 现已上线,Cerebras正在寻求展示其技术并实现更广泛的采用。与英伟达公司的GPU不同,后者以小型PCIe卡或SXM模块的形式打包,这台超级计算机是使用整个硅晶圆制成的巨型计算机芯片构建的,其大小与披萨相当。
每一个CS- 2 加速器据说拥有 85 万个核心,并拥有40 GB静态随机存取存储器,能够实现20 PB每秒的带宽。每个晶圆都配备了 12 个能够达到100 GB每秒速度的接口,允许 192 个晶圆互连成一个强大无比的系统。
目前,Condor Galaxy1 占据了 32 个机架,这意味着它是该公司去年宣布的Andromeda超级计算机的两倍大。它得到了由Advanced Micro Devices Inc.制造、处理网络等管理任务(如网络)的36, 352 个Epyc中央处理单元(CPU)的帮助,使CS- 2 加速器能够将其全部能力用于AI工作负载。这些规格将在未来几周内随着第二阶段的上线而加倍。