快科技旧金山现场报道:
除了推出经升级的Instinct MI325X GPU加速卡,AMD还发布了新一代Instinct MI350系列首款产品“Instinct MI355X”,并公布了部分规格和性能数据。
MI355X预计将于2025年下半年上市,约一年后。
MI350系列将首次采用台积电3nm工艺、CNDA 4架构,并引入FP6和FP4浮点数据类型,搭配高达288GB HBM3E内存。
功耗并未公开,但MI325X已达1000W,AMD表示MI355X将遵循行业趋势(NVIDIA B200 1000W、GB200 1700W),因此功耗将明显超过1000W。
FP6和FP4都是浮点数据格式,分别表示6位和4位精度,即只需使用6位或4位即可表示一个数字,与FP16和F8精度相比精度大幅降低,但数据处理量也显著减少,适用于大模型量化,尤其是大语言模型和混合专家模型。
对于不需要高精度且更注重速度的场景,FP6和FP4非常适合。
MI355X上的FP6和FP4浮点性能均为9.2 PFlops(每秒9200万亿次运算),同时FP16和FP8性能提升了80%,分别达到2.3 PFlops和4.6 PFlops。
NVIDIA Blackwell GPU也引入了FP6和FP4精度,但性能更高,分别达到20 PFlops和40 PFlops。
单卡288GB HBM3E内存无可匹敌,带宽高达8TB/s。
相比MI325X分别增加了1/8和1/3,与目前上市的MI300X相比更是增加了50%。
对比竞品,Blackwell B200仅有192GB HBM3E,但带宽同样达到8TB/s。
MI355X支持单平台八卡,总计拥有2.3TB HBM3E内存、64TB/s带宽,FP16性能高达18.5 PFlops、FP8性能37 PFlops、FP6/FP4性能74 PFlops。
它也将于明年下半年供货。
Instinct系列的性能提升幅度显著,每代都有改进,跨代对比更是惊人。
MI355X与MI300X相比,FP16性能提升了7.4倍,HBM容量增加了1.5倍,可处理的模型参数规模从7140亿增加到4.2万亿,增长了6倍。
展望未来,2026年将推出再下一代Instinct MI400系列,基于再下一代CNDA架构(可能是CNDA 5),规格和性能将再次实现大幅提升。