让AI更懂物理世界，人大北邮上海AI Lab等提出多模态分割新方法

让AI像人类一样借助多模态线索定位感兴趣的物体，有新招了!来自人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出Ref-AVS（Refer and Segment Objects in Audio-Visual Scenes，视听场景下的指代分割），让AI能看、会听，更懂真实物理世界。相关论文已入选顶会ECCV2024。举

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

2024-11-192.5万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

让AI更懂物理世界，人大北邮上海AI Lab等提出多模态分割新方法

推荐关键词

24小时热搜

大家正在看

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

日男子用AI造计算机病毒被判：只因想寻找轻松赚钱的方式

不做Sora背后：百度的多模态路线是什么？

图像伪造照妖镜！北大发布多模态LLM图像篡改检测定位框架FakeShield

微软开源多功能视觉模型Florence-2，分割、识别一切图片！

实时互动情感陪伴，Soul App升级多模态大模型探索AI社交新可能

首个可保留情感的音频LLM！Meta重磅开源7B-Spirit LM，一网打尽「音频+文本」多模态任务

英伟达发布视觉AI Agent，能用AI总结真实世界了

25岁日本男子利用AI制造计算机病毒：被判处有期徒刑3年

INDEMIND视觉感知技术，为具身智能构建物理“感官”

Meta推出新一代智能触觉系统机械手可实现多模态环境感知

凌华智能工业级迷你计算机与全机IP69K防水触控计算机荣获台湾省台湾精品奖

AI日报：科大讯飞星火多模态交互大模型上线；Anthropic发布提示词优化新功能；腾讯AI智能工作台ima上线Windows版

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

刚刚，沈向洋官宣通用视觉大模型！无需提示，就能识别万物

AI助力短剧，技术、艺术踏入同一条河流

国产手机年终大战：集体涨价 AI技术崛起

AI技术重塑情趣行业智能情趣产品惊喜亮相

超GPT-4o，1240亿参数！最强开源多模态模型 Pixtral Large！

AI技术显现创新势能，三星第七次亮相进博会

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

让AI更懂物理世界，人大北邮上海AI Lab等提出多模态分割新方法

推荐关键词

24小时热搜

大家正在看

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

日男子用AI造计算机病毒被判：只因想寻找轻松赚钱的方式

不做Sora背后：百度的多模态路线是什么？

图像伪造照妖镜！北大发布多模态LLM图像篡改检测定位框架FakeShield

微软开源多功能视觉模型Florence-2，分割、识别一切图片！

实时互动 情感陪伴，Soul App升级多模态大模型探索AI社交新可能

首个可保留情感的音频LLM！Meta重磅开源7B-Spirit LM，一网打尽「音频+文本」多模态任务

英伟达发布视觉AI Agent，能用AI总结真实世界了

25岁日本男子利用AI制造计算机病毒：被判处有期徒刑3年

INDEMIND视觉感知技术，为具身智能构建物理“感官”

Meta推出新一代智能触觉系统机械手 可实现多模态环境感知

凌华智能工业级迷你计算机与全机IP69K防水触控计算机荣获台湾省台湾精品奖

AI日报：科大讯飞星火多模态交互大模型上线；Anthropic发布提示词优化新功能；腾讯AI智能工作台ima上线Windows版

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

刚刚，沈向洋官宣通用视觉大模型！无需提示，就能识别万物

AI助力短剧，技术、艺术踏入同一条河流

国产手机年终大战：集体涨价 AI技术崛起

AI技术重塑情趣行业 智能情趣产品惊喜亮相

超GPT-4o，1240亿参数！最强开源多模态模型 Pixtral Large！

AI技术显现创新势能，三星第七次亮相进博会

实时互动情感陪伴，Soul App升级多模态大模型探索AI社交新可能

Meta推出新一代智能触觉系统机械手可实现多模态环境感知

AI技术重塑情趣行业智能情趣产品惊喜亮相