谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

站长之家(ChinaZ.com) 3月19日消息:在最新的研究论文中，谷歌研究人员引入了一种名为Cappy的预训练评分器模型，旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型（LLM）所面临的挑战，其中包括高昂的计算资源成本和效率低下的训练和推理过程。

谷歌 (2)

目前，多任务法学硕士如T0、FLAN和OPT-IML等被广泛应用于各种自然语言处理任务，并在统一的指令跟踪框架下进行训练。然而，这些模型由于巨大的规模和硬件要求，使得它们在适应下游应用程序时面临着挑战。为了应对这些挑战，Cappy被引入作为一种轻量级的预训练评分器，旨在提高多任务法学硕士的性能和效率。

Cappy的架构基于RoBERTa，顶部有一个用于回归的线性层，利用多样化的数据集集合进行预训练，确保覆盖广泛的任务类型。研究人员还提出了一种数据构建方法，以满足预训练数据中标签多样性的需求，并生成一个大型有效的回归预训练数据集。Cappy的应用程序涉及一种候选者选择机制，可独立运行于分类任务，也可作为生成任务的辅助组件，增强现有多任务LLM的解码。

通过引入轻量级预训练评分器Cappy，这项研究解决了在多任务场景中有效利用大型语言模型的挑战，展示了其在各种任务上的参数效率和性能的优越性，同时强调了在实际应用中简化大型语言模型采用的潜力。

道地食材结合宫廷古方：北京食养药膳医学研究院构建全链路溯源体系

2026-07-072.2万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

推荐关键词

24小时热搜

大家正在看

马斯克的Grok上线Build模式：可通过自然语言生成网站、应用

撞期DS V4 谷歌Gemini 3.5 Pro大模型被指17日发布：性能显著提升

谷歌研发全新“Frozen”专用芯片大幅提升AI模型运行效率

10万小时真实数据预训练！小米发布机器人基座模型Xiaomi-Robotics-1

百度智能云完成64B世界模型512卡训练验证支撑大模型高效Scale

腾讯最强语言模型转正！混元Hy3正式发布：更聪明、更便宜

如何提升AI生成3D模型的可用性？企业为什么需要系统化布局

SpaceXAI首个编程智能体模型Grok 4.5发布：与Cursor联合训练效率翻倍价格减半

全球最大2.8万亿参数大模型 Kimi K3今晚正式开源：性能坐稳前三

豆包图像创作模型Seedream 5.0 Pro API上线：像素级编辑、专业级可控

考拉悠然携Geek Mind亮相APEC数字周：以世界模型推动具身智能走向真实世界

AI日报：谷歌发布 Gemini 3.6 Flash；小红书大模型IMO满分夺金；腾讯Miora AI创意平台全量上线

总开空调和不开空调的人谁更健康：研究发现高温加速衰老

看世界杯全民逐帧研究？海信百吋电视把VAR搬进客厅

小米发布并开源Xiaomi-Robotics-U0：380亿参数具身生成大模型！生成效率提升83倍

道地食材结合宫廷古方：北京食养药膳医学研究院构建全链路溯源体系

谷歌Pixel 11系列发布会定档8月12日：四机齐发！售价全面上涨

告别繁琐操作，基恩士 VL 扫描仪提升检测效率新高度

有了HappyHorse，为何阿里还总在「骑马找驴」

行业第一！海尔连续十年上榜“谷歌&凯度BrandZ中国全球化品牌50强”

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

推荐关键词

24小时热搜

大家正在看

马斯克的Grok上线Build模式：可通过自然语言生成网站、应用

撞期DS V4 谷歌Gemini 3.5 Pro大模型被指17日发布：性能显著提升

谷歌研发全新“Frozen”专用芯片 大幅提升AI模型运行效率

10万小时真实数据预训练！小米发布机器人基座模型Xiaomi-Robotics-1

百度智能云完成64B世界模型512卡训练验证 支撑大模型高效Scale

腾讯最强语言模型转正！混元Hy3正式发布：更聪明、更便宜

如何提升AI生成3D模型的可用性？企业为什么需要系统化布局

SpaceXAI首个编程智能体模型Grok 4.5发布：与Cursor联合训练 效率翻倍价格减半

全球最大2.8万亿参数大模型 Kimi K3今晚正式开源：性能坐稳前三

豆包图像创作模型Seedream 5.0 Pro API上线：像素级编辑、专业级可控

考拉悠然携Geek Mind亮相APEC数字周：以世界模型推动具身智能走向真实世界

AI日报：谷歌发布 Gemini 3.6 Flash；小红书大模型IMO满分夺金；腾讯Miora AI创意平台全量上线

总开空调和不开空调的人谁更健康：研究发现高温加速衰老

看世界杯全民逐帧研究？海信百吋电视把VAR搬进客厅

小米发布并开源Xiaomi-Robotics-U0：380亿参数具身生成大模型！生成效率提升83倍

道地食材结合宫廷古方：北京食养药膳医学研究院构建全链路溯源体系

谷歌Pixel 11系列发布会定档8月12日：四机齐发！售价全面上涨

告别繁琐操作，基恩士 VL 扫描仪提升检测效率新高度

有了HappyHorse，为何阿里还总在「骑马找驴」

行业第一！海尔连续十年上榜“谷歌&凯度BrandZ中国全球化品牌50强”

谷歌研发全新“Frozen”专用芯片大幅提升AI模型运行效率

百度智能云完成64B世界模型512卡训练验证支撑大模型高效Scale

SpaceXAI首个编程智能体模型Grok 4.5发布：与Cursor联合训练效率翻倍价格减半