站长之家 - 业界 2026-02-23 00:31

GLM-5大模型官宣支持7大国产芯片平台:华为、寒武纪、摩尔线程等在列

2月22日,春节假期期间,国内多家科技公司相继发布了新一代大型语言模型。其中,智谱公司推出的GLM-5模型引发了广泛关注。

根据官方介绍,GLM-5的核心升级方向聚焦于编程与智能体能力的强化。该模型参数量达到7440亿,约为上一代GLM-4.X系列的两倍,整体性能提升显著。

有海外技术评测显示,该模型在代理编程任务中表现突出,综合编程能力也位居全球前列。其发布后,由于访问需求激增,一度对计算资源造成压力,影响了部分用户体验。为此,智谱公司已公开致歉并公布了相应的补偿措施。

近日,智谱公司进一步公开了GLM-5的技术报告,详细阐述了驱动性能跃升的四大关键技术突破:

  1. 采用新型稀疏注意力机制: 该机制能够依据信息的重要性动态分配计算资源,从而在保持长文本理解与深度推理能力的同时,显著降低了模型训练与运行过程中的计算成本。这使得模型参数规模得以扩展至7440亿,并完成了28.5万亿标记(Token)的训练。
  2. 构建异步强化学习基础设施: 新基础设施实现了生成与训练过程的深度解耦,极大提升了硬件计算资源的利用率。该系统支持模型进行大规模的智能体轨迹探索,有效解决了以往制约迭代效率的同步瓶颈,让强化学习训练流程更加高效。
  3. 提出异步智能体强化学习算法: 新算法旨在全面提升模型的自主决策质量。与上一代技术相比,该算法使模型能够从更复杂、更长期的任务交互中持续学习,特别优化了在动态环境中的规划与自我修正能力,这被认为是其在实际编程应用中表现优异的技术基础。
  4. 全面适配国产计算生态: GLM-5从设计之初便致力于兼容国产硬件平台。智谱公司已完成从底层计算内核到上层推理框架的全栈优化,目前全面支持包括华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原在内的七大主流国产芯片平台。报告指出,在单台国产计算节点上,GLM-5的性能已可比肩由两台国际主流GPU组成的集群,且在处理长序列任务时,部署成本可降低约50%。
GLM-5大模型宣布支持七大国产芯片平台

GLM-5大模型宣布支持七大国产芯片平台

推荐关键词

24小时热搜

查看更多内容

大家正在看

智谱,大力出AI