阿里云栖大会发布新一代人工智能模型 技术指标全球领先
9月24日 杭州电
在今日开幕的2025云栖大会上,阿里巴巴集团正式发布了其最新研发的Qwen3-Max人工智能模型。根据官方公布的数据显示,该模型在多项国际权威测试中表现优异,技术指标已进入全球领先行列。
据了解,Qwen3-Max分为指令优化和推理增强两个版本。目前其预览版本已在国际知名的人工智能基准测试平台Chatbot Arena中排名第三,正式版本有望实现进一步突破。
作为通义千问系列的最新旗舰产品,Qwen3-Max采用了36万亿token的超大规模预训练数据,模型参数量突破万亿级别。特别值得注意的是,该模型在编程代码生成和智能工具调用方面展现出显著优势。
在SWE-Bench Verified测试中,Qwen3-Max指令版本以69.6分的成绩位居全球前列;而在Tau2-Bench工具调用能力测试中,该模型更是以74.8分的成绩超越了多个国际知名产品。
Qwen3-Max模型在多项测试中表现优异
特别值得关注的是,Qwen3-Max的推理增强版本在数学推理能力测试中取得突破性进展。在AIME 25和HMMT两项专业数学测试中均获得满分,这在国内人工智能领域尚属首次。
技术专家介绍,该模型之所以能在数学推理方面取得优异成绩,主要得益于其创新的工具调用机制和并行计算技术。模型能够通过编写代码来求解数学问题,同时优化的计算资源分配也显著提升了整体表现。
Qwen3-Max在数学推理测试中获得满分
目前,通义千问系列已经形成了从基础版到高端版的完整产品矩阵,包含300余个不同规模的模型,能够满足各类应用场景的需求。
即日起,用户可以通过通义千问官方平台免费体验Qwen3-Max模型,企业用户也可以通过阿里云服务平台获取专业的API接口服务。
推荐关键词
24小时热搜
-
热
- 1 沙特申博宣传片真是中国拍的 网友:这风格意境是中国的手笔
- 2 南方人东北购物被店主语气“凶哭”:文化差异导致误解
- 3 女子下班回家发现家门口被贴U盘:新型诈骗手段?
- 4 爸爸送娃撂下就走结果学校没开门:交警协助联系 安全返家
-
热
- 5 宗庆后在黄金地段为员工建廉租房:从不裁45岁以上员工 我算有钱
- 荐 2020年高通骁龙CPU排名 高通骁龙888排名领先