返回

站长之家 - 业界 2023-11-07 16:41

GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白，研究人员引入了PowerPoint任务完成（PPTC）基准测试，以评估LLM创建和编辑PPT文档的能力。最近对大型语言模型（例如ChatGPT和GPT-4）进行的评估工作主要侧重于在基本自然语言任务上的能力

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

推荐关键词

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

星辰智能体：TeleAgent不只给答案，还能把文档、表格和PPT做完

2026-07-179311阅读

像真人聊天！OpenAI发布GPT-Live：AI可同步听与说

2026-07-093610阅读

经常做PPT汇报，4000元以内哪款笔记本合适？这两款酷睿第三代机型值得选购

2026-07-101.0万阅读

OpenAI最强模型！Gpt-5.6系列发布：Codex、ChatGpt Work智能体三合一

2026-07-102.6万阅读

AI日报：GPT5.6系列模型发布 Codex消失;腾讯拟接盘Manus成最大股东；MiniMax创始人宣布零薪酬直至实现AGI

2026-07-103.0万阅读

AI日报：Claude Cowork登陆网页和手机端；美国放行GPT-5.6；Meta超级智能实验室首发图像生成模型

2026-07-082.4万阅读

AI日报：豆包千问同日下线智能体功能；GPT-5.6Sol被曝自主删除用户数据库；京东AI Agent与腾讯元宝打通小程序生态

2026-07-159672阅读

重磅福利！OpenAI官宣：GPT 5.5 Instant明日全民免费

2026-06-252.3万阅读

AI日报：苹果Xcode 26.6正式发布；美团“小店有AI”行动落地北京；OpenAI受限发布GPT-5.6

2026-06-261.6万阅读

2026破解PPT制作痛点：文多多AIPPT全链路赋能模型重构高效办公！

2026-05-142.4万阅读

GPT5.5：更贵不更烧，主角给到Codex，逼Claude慌忙修复降智问题

2026-04-272.6万阅读

iSlide 上线 macOS 插件版，进一步完善 AI 时代的 PPT 制作体验

2026-05-111.2万阅读

AI日报：豆包披露付费订阅方案；OpenAI发布GPT-5.5Instant；苹果手机支持第三方AI模型

2026-05-062.9万阅读

AI日报：GPT5.6开始内测；阿里2026财年Q4财报AI收入激增；MiniMax Agent正式更名Mavis

2026-05-146946阅读

AI日报：OpenAI未官宣新旗舰GPT-5.6意外曝光；昆仑万维发布天工SkyClaw-v1.0；阿里 Qwen3.7-Max 编程能力全球登顶第二

2026-05-269640阅读

2026年公司介绍PPT设计品牌推荐：会“讲故事”的PPT，才真能打动客户

2026-04-071.0万阅读

千问AI PPT升级：3分钟完成内容到排版逐步全量免费开放中

2026-04-221.5万阅读

OpenAI女神官宣离职了！曾被誉为GPT-4o之母

2026-04-101.8万阅读

OpenAI正式发布GPT-5.5：运算速度更快 Token成本大降

2026-04-241.8万阅读

文多多AIPPT：部分开源+私有化部署重构PPT创作体验

2026-03-202.7万阅读