站长之家 - 业界 2025-11-26 15:11

超越Gemini3、GPT5.1！阿里千问登顶空间推理全球冠军

11月26日，国际空间推理基准测试平台SpatialBench发布最新评测结果。阿里巴巴集团研发的视觉理解模型Qwen系列在本次测评中表现突出，其中Qwen3-VL-235B与Qwen2.5-VL-72B两款模型分别以13.5分和12.9分的成绩位列榜单前两位。

测评数据显示，这两款模型的得分已超越多家国际科技企业推出的同类产品，包括Gemini 3.0 Pro Preview（9.6分）与GPT-5.1（7.5分）等知名模型。

值得注意的是，当前技术水平与人类的空间推理能力仍存在明显差距。专业评估显示，人类在处理电路分析、CAD工程及分子生物学等复杂空间推理任务时，基准得分可达80分左右，现有技术尚无法完全替代人类完成这类专业性工作。

据了解，Qwen2.5-VL于2024年对外开放源代码，而Qwen3-VL作为其升级版本，于今年正式发布。新一代模型在视觉感知与多模态推理方面取得显著进展，在32项核心能力评估中表现优异。

该模型具备较强的实用功能，不仅能通过图像完成推理任务，还可基于设计草图或游戏视频片段进行视觉编程。此外，Qwen3-VL特别强化了三维空间检测能力，使搭载该技术的设备能够更准确地判断物体方位和视角变化，实现精准操作。

目前，该系列模型已推出多个版本，涵盖从2B到235B等不同规模，每款均提供指令版和推理版两种模式，受到技术开发团队的广泛关注。普通用户也可通过官方应用免费体验相关功能。

SpatialBench作为近年来备受关注的专业测评体系，主要评估多模态模型在空间、结构和路径等方面的综合推理能力，其测试结果被视为衡量智能技术发展水平的重要参考指标之一。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

超越Gemini3、GPT5.1！阿里千问登顶空间推理全球冠军

推荐关键词

24小时热搜

大家正在看

Testin XAgent实战解析：大模型+视觉自愈如何重构自动化测试工程

阿里Token Plan个人版发布 Qwen3.8-Max预览版同步上线

快手积极参加“全社会反诈青年在行动”宣传活动借AI大模型筑牢反诈“心”防线

AI日报：抖音电商将豆包纳入抖店结算序列;Claude Fable5访问权限延长至19日；商汤开源SenseNova-Vision统一视觉大模型

影像与山水相遇，视觉中国500px视觉盛典桂林站圆满举行

Veepai维拍物联构筑三层核心壁垒，重塑视觉物联服务标准

全球最大2.8万亿参数大模型 Kimi K3今晚正式开源：性能坐稳前三

当大模型公司开始造手机

苹果研发AI模型压缩技术：把270亿参数大模型装进iPhone

AI日报：SpaceXAI推出“Opus级”大模型Grok4.5;阶跃星辰首款AI智能体手机即将发布；蚂蚁灵波开源 LingBot-Video

大模型上手机，三星为何选中面壁智能？

SpaceXAI首个编程智能体模型Grok 4.5发布：与Cursor联合训练效率翻倍价格减半

AI日报：Kimi K3登顶全球最大开源模型；小度AI手表Fit开售；我国启动大模型 IPv6 专项行动

撞期DS V4 谷歌Gemini 3.5 Pro大模型被指17日发布：性能显著提升

芯位学科大模型V2.0：让教育AI从“通用回答”走向“专业解答”

AI视觉识别在菜品结算中的应用：从图像分割到边缘计算的落地实战

国产大模型之光Kimi K3火速上线白B.AI 一站式体验全球顶尖AI产品

百度智能云完成64B世界模型512卡训练验证支撑大模型高效Scale

超越Opus 4.7美国顶级大模型 Kimi K3即将发布：2.5万亿怪兽级AI

官宣！视觉中国签约摄影师7月22日起免门票游三清山

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

超越Gemini3、GPT5.1！阿里千问登顶空间推理全球冠军

推荐关键词

24小时热搜

大家正在看

Testin XAgent实战解析：大模型+视觉自愈如何重构自动化测试工程

阿里Token Plan个人版发布 Qwen3.8-Max预览版同步上线

快手积极参加“全社会反诈青年在行动”宣传活动 借AI大模型筑牢反诈“心”防线

AI日报：抖音电商将豆包纳入抖店结算序列;Claude Fable5访问权限延长至19日；商汤开源SenseNova-Vision统一视觉大模型

影像与山水相遇，视觉中国500px视觉盛典桂林站圆满举行

Veepai维拍物联构筑三层核心壁垒，重塑视觉物联服务标准

全球最大2.8万亿参数大模型 Kimi K3今晚正式开源：性能坐稳前三

当大模型公司开始造手机

苹果研发AI模型压缩技术：把270亿参数大模型装进iPhone

AI日报：SpaceXAI推出“Opus级”大模型Grok4.5;阶跃星辰首款AI智能体手机即将发布；蚂蚁灵波开源 LingBot-Video

大模型上手机，三星为何选中面壁智能？

SpaceXAI首个编程智能体模型Grok 4.5发布：与Cursor联合训练 效率翻倍价格减半

AI日报：Kimi K3登顶全球最大开源模型；小度AI手表Fit开售；我国启动大模型 IPv6 专项行动

撞期DS V4 谷歌Gemini 3.5 Pro大模型被指17日发布：性能显著提升

芯位学科大模型V2.0：让教育AI从“通用回答”走向“专业解答”

AI视觉识别在菜品结算中的应用：从图像分割到边缘计算的落地实战

国产大模型之光Kimi K3火速上线白B.AI 一站式体验全球顶尖AI产品

百度智能云完成64B世界模型512卡训练验证 支撑大模型高效Scale

超越Opus 4.7美国顶级大模型 Kimi K3即将发布：2.5万亿怪兽级AI

官宣！视觉中国签约摄影师7月22日起免门票游三清山

快手积极参加“全社会反诈青年在行动”宣传活动借AI大模型筑牢反诈“心”防线

SpaceXAI首个编程智能体模型Grok 4.5发布：与Cursor联合训练效率翻倍价格减半

百度智能云完成64B世界模型512卡训练验证支撑大模型高效Scale