谷歌推创新框架AGREE 可增强大模型生成内容准确性

站长之家（ChinaZ.com）6月11日消息:谷歌研究院推出了一个名为AGREE的创新框架，旨在增强大型语言模型（LLM）生成内容和引用的准确性。这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础，并提供相应的引用，从而提高回答的准确性，并为用户提供验证信息真实性的途径。

核心技术:

训练阶段微调:使用基础大模型生成回答，并利用自然语言推理模型（NLI）评估段落是否支持特定声明。AGREE框架使用NLI模型从未标记的查询中自动构建训练数据集，通过匹配回答和检索到的文档，为每个声明找到最相关的支持性段落。
测试时自适应:一种动态、迭代的推理增强方法，帮助大模型在面对新的内容查询时，主动从大型语料库中检索相关信息，并对生成的回答进行补充和修正。

AGREE的工作流程:

在微调阶段，AGREE框架采用LORA的轻量级微调技术，通过在大模型的权重矩阵上添加低秩更新，实现高效且针对性的调整，减少计算资源消耗，同时保持模型泛化能力。

测试时自适应从接收到新查询开始，微调后的大模型根据训练阶段学到的知识生成初步回答，然后进入自动迭代过程，自我评估并识别需要额外支持的声明。

一旦识别出需要额外信息的声明，启动检索过程，在预构建的语料库中搜索相关段落，并将这些段落与先前回答结合，生成更完善、准确的内容。

实验结果:

研究人员在Llama-2-13b等知名大模型上进行了实验，结果显示AGREE在提升内容回答准确性和引用性方面表现突出。

论文地址：https://arxiv.org/pdf/2311.09533

李开复周志华纵论AI大模型，万字梳理MEET'25大咖激辩，320万观众同见证

2024-12-133.0万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌推创新框架AGREE 可增强大模型生成内容准确性

推荐关键词

24小时热搜

大家正在看

AI大模型时代，人才的需求已经变了

AI日报：百川智能金融大模型发布；ChatGPT新增跨对话记忆功能；DeepSeek大模型一开发者将加盟小米；OpenAI最强推理模型o3

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10，细节全公开

AI大模型时代下的天融信：安全领域的智能先锋

灰豚AI数字人重磅突破，国内最强数字人AI口播软件大模型来袭

大模型不再有信仰

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源；ChatGPT搜索有被操纵风险

李开复周志华纵论AI大模型，万字梳理MEET'25大咖激辩，320万观众同见证

你还说这是AI？我们体验了一波生成亚洲人最好看的文生图大模型

AI新风向：思必驰“分布式大模型智能体系统”赋能产业未来

首次！大模型自动搜索人工生命，做出AI科学家的Sakana AI又放大招

业内首个！京东发布“AI京医”大模型：准确率达99.5%

大模型，在内卷中寻找出口

出圈就好！盘点2024年国内AI大模型产品的那些破圈姿势

理想同学AI大模型APP抢鲜体验：识物精准、语音交互流畅

AI日报：阿里通义开源多模态推理模型QVQ-72B；OpenAI考虑自研人形机器人；QQ音乐上线首个AI大模型音效

大模型六小虎，要撞上版权墙了

AI大模型的2024：有人融资50亿，有人苦等变现丨年度盘点

曝雷军挖了个95后天才少女“AI小萝莉”：开出千万年薪恶补大模型

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌推创新框架AGREE 可增强大模型生成内容准确性

推荐关键词

24小时热搜

大家正在看

AI大模型时代，人才的需求已经变了

AI日报：百川智能金融大模型发布；ChatGPT新增跨对话记忆功能；DeepSeek大模型一开发者将加盟小米；OpenAI最强推理模型o3

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10，细节全公开

AI大模型时代下的天融信：安全领域的智能先锋

灰豚AI数字人重磅突破，国内最强数字人AI口播软件大模型来袭

大模型不再有信仰

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源；ChatGPT搜索有被操纵风险

李开复周志华纵论AI大模型，万字梳理MEET'25大咖激辩，320万观众同见证

你还说这是AI？我们体验了一波生成亚洲人最好看的文生图大模型

AI新风向：思必驰“分布式大模型智能体系统”赋能产业未来

首次！大模型自动搜索人工生命，做出AI科学家的Sakana AI又放大招

业内首个！京东发布“AI京医”大模型：准确率达99.5%

大模型，在内卷中寻找出口

出圈就好！盘点2024年国内AI大模型产品的那些破圈姿势

理想同学AI大模型APP抢鲜体验：识物精准、语音交互流畅

AI日报：阿里通义开源多模态推理模型QVQ-72B；OpenAI考虑自研人形机器人；QQ音乐上线首个AI大模型音效

大模型六小虎，要撞上版权墙了

AI大模型的2024：有人融资50亿，有人苦等变现丨年度盘点

曝雷军挖了个95后天才少女“AI小萝莉”：开出千万年薪 恶补大模型

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

曝雷军挖了个95后天才少女“AI小萝莉”：开出千万年薪恶补大模型