返回

站长之家 - 业界 2024-06-04 14:47

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策!这种方法得到的模型，已经学会了看图玩扑克、算“12点”等任务，表现甚至超越了GPT-4v。这是来自UC伯克利等高校最新提出的微调方法，研究阵容也是相当豪华:图灵奖三巨头之一、Meta首席AI科学家、纽约大学教授LeCu

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

推荐关键词

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

DeepSeek深夜发布全新多模态大模型性能碾压OpenAI

2025-01-281.3万阅读

Sam Altman炸场东京，亲曝GPT-5研发路线图，多模态能力颠覆传统

2025-02-041.4万阅读

多模态卷王阶跃震撼6连发，春节档最强AI家族来袭！

2025-01-225030阅读

百度今年将发布人工智能模型Ernie 5.0：大幅增强多模态能力

2025-02-122.3万阅读

中科金财多模态应用拓展新领域，AI大剧1月24日起快手独播

2025-01-241.4万阅读

滚烫Deepseek一夜刀掉英伟达4万亿，除夕开源多模态新模型：7B超越DALL-E 3和StableDiffusion

2025-01-281.0万阅读

AI日报：赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;清影2.0上线智谱清言

2025-01-213541阅读

三星Galaxy S25系列多模态感知树立人机交互新范式

2025-01-232.5万阅读

搭载多模态AI助理三星Galaxy S25系列重塑移动AI新格局

2025-01-239054阅读

Kimi硬刚多模态满血版o1，首曝训练细节！强化学习scaling新范式诞生

2025-01-212.3万阅读

OpenAI开启调查：GPT-4o及4o-mini模型性能下降

2025-01-204238阅读

Anthropic秘密「混合模型」 Claude 4首曝细节，硬刚GPT-5！深度推理模型来了

2025-02-152.7万阅读

月之暗面推出全新SOTA模型k1.5：可同时处理不同模态信息

2025-01-211.1万阅读

国产医疗AI大模型新高度！LungDiag发布：诊疗准确度高于临床专家和GPT-4.o

2025-01-212.8万阅读

GPT-4.5马上发布，GPT-5免费畅聊！奥特曼剧透大动作，网友：让DeepSeek整破防了

2025-02-131.1万阅读

OpenAI凌晨放王炸！GPT-5即将发布免费无限使用

2025-02-132.9万阅读

阿里云通义开源Qwen2.5-VL：最强视觉AI 超越GPT-4o

2025-01-281.2万阅读

OpenAI放王炸！GPT-5免费无限使用，产品矩阵大整合！

2025-02-132.0万阅读

上优刻得，国内外轻松调用DeepSeek-R1/V3「满血」模型

2025-02-107388阅读

AI日报：字节启动AGI计划代号“Seed Edge”；智谱GLM-PC电脑智能体大模型开放体验；阶跃星辰视频模型Step-Video V2版发布

2025-01-233.0万阅读