站长之家 - 业界 2025-01-28 15:02

阿里云通义开源Qwen2.5-VL：视觉AI 超越GPT-4o

阿里云通义推出视觉模型 Qwen2.5-VL

阿里云通义近日开源了其最新的视觉模型 Qwen2.5-VL，该模型推出三个版本：3B、7B 和 72B。其中，旗舰版 Qwen2.5-VL-72B 在 13 项权威评测中夺得视觉理解冠军，超越了 GPT-4o 和 Claude3.5。

Qwen2.5-VL 模型能够更准确地解析图像内容，并支持超过 1 小时的视频理解。它可以在视频中搜索特定事件，并对视频的不同时间段进行要点总结，帮助用户快速有效地提取视频中的关键信息。

此外，Qwen2.5-VL 还可以无需微调就变身为一个能够操控手机和电脑的 AI 视觉智能体（Visual Agents），实现给指定朋友发送祝福、电脑修图、手机订票等多步骤复杂操作。

Qwen2.5-VL 不仅擅长识别常见物体，还能够分析图像中的文本、图表、图标、图形和布局。它还将 OCR 识别能力提升到了一个新的水平，增强了多场景、多语言和多方向的文本识别和定位能力。

在信息抽取方面，Qwen2.5-VL 也进行了大幅度增强，以满足日益增长的资质审核、金融商务等数字化、智能化需求。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

2025-01-302.2万阅读

苹果发布iOS 18.3正式版：默认开启视觉智能

2025-01-285690阅读

从智能体到世界模型，2025年AI行业还会发生哪些大事？

2025-01-151.5万阅读

帮村里接通AI就靠它！34个地域超拟人AI智能体上线，背后技术也被我们扒出来了

2025-01-251.4万阅读

AI智能体2小时击败人类，引爆贝叶斯推理革命！仅用10%数据训练秒杀大模型

2025-01-212.1万阅读

OpenAI率先打样，今年AI圈的主角是智能体

2025-01-201.3万阅读

阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误

2025-01-162.2万阅读

智谱发布电脑智能体大模型GLM-PC：回车即用协助完成各类电脑任务

2025-01-243717阅读

OpenAI源代码分享！实时AI Agent，20分钟开发语音智能体

2025-01-201.9万阅读

AI新风向：思必驰“分布式大模型智能体系统”赋能产业未来

2025-01-101.1万阅读

AI日报：字节启动AGI计划代号“Seed Edge”；智谱GLM-PC电脑智能体大模型开放体验；阶跃星辰视频模型Step-Video V2版发布

2025-01-232.7万阅读

用大模型吃瓜更智能了！阿里通义实验室提出新时间线总结框架，全面提升新闻总结效率

2025-01-077987阅读

刚刚，OpenAI发布AI Agent—Operator，全民智能体时代来了！

2025-01-242.0万阅读

AI日报：“即创”正式版上线；2024胡润中国AI企业50强榜单；通义万相推2.1视频模型；微软开源超强小模型Phi-4

2025-01-099261阅读

AI爆程序员失业潮！小扎正开发编程智能体，「中级程序员」剩最后一年？

2025-01-132.5万阅读

扎克伯格：Meta今年将开发AI编程智能体媲美中级软件工程师

2025-01-131.1万阅读

AI日报：百川智能深度思考模型Baichuan-M1-preview；OpenAI发布首个AI智能体Operator；HeyGen新增数字人运动控制功能

2025-01-241.7万阅读

国人骄傲！阿里云、华为首席技术官双双入选美国计算机协会

2025-01-232.7万阅读

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

2025-01-085216阅读

AI博士智能体自主科研，o1-preview封神成本暴降84%！AMD霍普金斯新作爆火

2025-01-142.6万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

阿里云通义开源Qwen2.5-VL：视觉AI 超越GPT-4o

阿里云通义推出视觉模型 Qwen2.5-VL

推荐关键词

24小时热搜

大家正在看

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

苹果发布iOS 18.3正式版：默认开启视觉智能

从智能体到世界模型，2025年AI行业还会发生哪些大事？

帮村里接通AI就靠它！34个地域超拟人AI智能体上线，背后技术也被我们扒出来了

AI智能体2小时击败人类，引爆贝叶斯推理革命！仅用10%数据训练秒杀大模型

OpenAI率先打样，今年AI圈的主角是智能体

阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误

智谱发布电脑智能体大模型GLM-PC：回车即用协助完成各类电脑任务

OpenAI源代码分享！实时AI Agent，20分钟开发语音智能体

AI新风向：思必驰“分布式大模型智能体系统”赋能产业未来

AI日报：字节启动AGI计划代号“Seed Edge”；智谱GLM-PC电脑智能体大模型开放体验；阶跃星辰视频模型Step-Video V2版发布

用大模型吃瓜更智能了！阿里通义实验室提出新时间线总结框架，全面提升新闻总结效率

刚刚，OpenAI发布AI Agent—Operator，全民智能体时代来了！

AI日报：“即创”正式版上线；2024胡润中国AI企业50强榜单；通义万相推2.1视频模型；微软开源超强小模型Phi-4

AI爆程序员失业潮！小扎正开发编程智能体，「中级程序员」剩最后一年？

扎克伯格：Meta今年将开发AI编程智能体媲美中级软件工程师

AI日报：百川智能深度思考模型Baichuan-M1-preview；OpenAI发布首个AI智能体Operator；HeyGen新增数字人运动控制功能

国人骄傲！阿里云、华为首席技术官双双入选美国计算机协会

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

AI博士智能体自主科研，o1-preview封神成本暴降84%！AMD霍普金斯新作爆火

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

阿里云通义开源Qwen2.5-VL：视觉AI 超越GPT-4o

阿里云通义推出视觉模型 Qwen2.5-VL

推荐关键词

24小时热搜

大家正在看

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

苹果发布iOS 18.3正式版：默认开启视觉智能

从智能体到世界模型，2025年AI行业还会发生哪些大事？

帮村里接通AI就靠它！34个地域超拟人AI智能体上线，背后技术也被我们扒出来了

AI智能体2小时击败人类，引爆贝叶斯推理革命！仅用10%数据训练秒杀大模型

OpenAI率先打样，今年AI圈的主角是智能体

阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误

智谱发布电脑智能体大模型GLM-PC：回车即用 协助完成各类电脑任务

OpenAI源代码分享！实时AI Agent，20分钟开发语音智能体

AI新风向：思必驰“分布式大模型智能体系统”赋能产业未来

AI日报：字节启动AGI计划代号“Seed Edge”；智谱GLM-PC电脑智能体大模型开放体验；阶跃星辰视频模型Step-Video V2版发布

用大模型吃瓜更智能了！阿里通义实验室提出新时间线总结框架，全面提升新闻总结效率

刚刚，OpenAI发布AI Agent—Operator，全民智能体时代来了！

AI日报：“即创”正式版上线；2024胡润中国AI企业50强榜单；通义万相推2.1视频模型；微软开源超强小模型Phi-4

AI爆程序员失业潮！小扎正开发编程智能体，「中级程序员」剩最后一年？

扎克伯格：Meta今年将开发AI编程智能体 媲美中级软件工程师

AI日报：百川智能深度思考模型Baichuan-M1-preview；OpenAI发布首个AI智能体Operator；HeyGen新增数字人运动控制功能

国人骄傲！阿里云、华为首席技术官双双入选美国计算机协会

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

AI博士智能体自主科研，o1-preview封神成本暴降84%！AMD霍普金斯新作爆火

智谱发布电脑智能体大模型GLM-PC：回车即用协助完成各类电脑任务

扎克伯格：Meta今年将开发AI编程智能体媲美中级软件工程师