站长之家 - 业界 2021-12-01 10:31

亚马逊宣布基于Trn1机器学习芯片的新EC2实例

近年来,已有越来越多的企业开始选择为其客户提供基于定制芯片的服务,比如亚马逊 AWS 就在 2019 年推出了旨在加速推理学习的 Inferentia 芯片。去年,这家科技巨头推出了专为机器学习模型和设计的第二款 Trainium 芯片。而在之前工作的基础上,我们现又迎来了最新的 Trn1 机器学习芯片。

(来自:AWS)

在今早于拉斯维加斯举办的 AWS re:Invent 主题演讲期间,Adam Selipsky 在台上介绍了该公司的最新芯片进展。

今天,我们很高兴地向大家宣布由 Trainium 提供支撑的新 Trn1 实例。除了在 EC2 上快速运行,我们还希望它能够为在云端训练深度学习模型提供最佳性价比。

此外 Trn1 是首个带宽高达 800 GB/s 的 EC2 实例,很适合大规模、多节点的分布式训练用例,比如图像识别、自然语言处理(NLP)、欺诈检测、以及预测等。


New Amazon EC2 Trn1 instances - Amazon Web Services(via)

更重要的是,客户能够选择将这些芯片联网到一起、并放入“超级群”(Ultra Clusters)中,以获得更强大的性能体验。

“超级群”包含了数万个与 PB 级网络互连的训练加速器,背后有着强大的超算为机器学习用例提供支撑,可快速训练具有数万亿个参数的最复杂的深度学习模型。

最后,Adam Selipsky 表示该公司计划与 SAP 等伙伴达成合作,以更好地发挥 Trn1 新芯片的处理能力。

推荐关键词

24小时热搜

查看更多内容

大家正在看