国产GPU正式进入万卡万P时代!
在游戏显卡和AI加速卡领域,NVIDIA一家独大。而现在,我们不仅需要自己的游戏卡,更需要自己的加速卡。
摩尔线程扛起了这一重任。继交付全国产千卡千亿模型算力集群后,又率先拓展到了万卡、万P、万亿规模。
摩尔线程万卡智算集群
摩尔线程宣布,其AI旗舰产品夸娥(KUAE)智算集群解决方案重大升级,从千卡级别扩展至万卡规模,具备万P级或10E级浮点运算能力。
万卡集群由1万张或更多GPU组成,主要用于训练超大规模基础大模型。它整合了高性能GPU计算、RDMA网络、并行文件存储等技术,可大幅提高训练效率和缩短训练时间。
国外科技巨头布局万卡集群
国外科技巨头纷纷部署了万卡集群。马斯克的新一代AI聊天机器人Grok 3使用了10万张NVIDIA H100加速卡进行训练。谷歌的A3 Virtual Machines拥有2.6万块H100 GPU,Meta的两个集群拥有24576块H100 GPU。
国内企业积极推进万卡集群建设
国内企业也在积极推进万卡集群建设。字节跳动搭建了一个12288张卡的训练集群,科大讯飞建成了首个支持大模型训练的超万卡集群算力平台。
摩尔线程挑战万卡集群
万卡集群并非简单的计算卡叠加,需要解决超大规模组网互联等众多难题。摩尔线程作为一家成立不到4年的国产GPU企业,为何要去挑战这一难题?
摩尔线程希望建设一个规模超万卡、场景更通用、生态兼容好的加速计算平台,优先解决大模型训练难题。
夸娥全栈解决方案
夸娥是摩尔线程的智算中心全栈解决方案,包括基础设施、集群管理平台和模型服务平台。它支持大规模GPU算力集群的建设、运营管理,提供开箱即用的体验。
摩尔线程万卡集群优势
摩尔线程万卡集群具备超大显存总容量、超高速卡间互联总带宽和超高速节点互联总带宽,能实现超强的算力,MFU最高可达60%。
它还拥有卓尔不群的稳定性,平均无故障运行时间超过15天,周均训练有效率超过99%。
强大的通用性
摩尔线程万卡集群支持所有主流大模型训练,可加速不同架构、不同模态的大模型。它兼容主流分布式训练框架,并提供高效易用的编程语言和自动化迁移工具。
无缝迁移
已经适配过摩尔线程千卡集群的用户无需额外工作即可无缝运行在万卡集群上。对于首次适配万卡集群的用户,迁移时间也只需几个小时。
全栈覆盖
摩尔线程实现了从芯片到算力卡、从一体机到节点集群的全栈式覆盖,支持从单机多卡到多机多卡、从单卡到千卡万卡集群的无缝扩展。
战略签约
摩尔线程已完成青海零碳产业园万卡集群、青海高原万卡集群和广西东盟万卡集群等三项战略签约。
生态迅速扩大
摩尔线程的生态正在迅速扩大,与国内外AI厂商、云厂商、科技厂商等建立了深入合作。
WAIC 2024展示
在WAIC 2024期间,摩尔线程展示了全栈解决方案,包括芯片、算力卡、服务器、一体机节点、AI算力底座、AIGC创作生产力、产业数智化升级等。
产业数智化升级应用
基于摩尔线程夸娥智算集群,气象、公共安全、数字交通、辅助决策、智慧安防、智能金融、智慧政务等领域实现了产业数智化升级应用。
值得一提的是,风乌大模型通过无缝迁移至摩尔线程万卡集群,实现了全国产化,性能、精度达到国际先进水平。