华盛顿大学推高效大模型调优方法“代理调优”

要点:
1、代理调优方法无需接触模型的内部权重。
2、通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测。
3、代理调优方法能够在解码时更好地保留训练知识。

站长之家（ChinaZ.com）1月24日消息:华盛顿大学推出更高效的大模型调优方法“代理调优”，该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测，实现对模型的调优而无需接触模型的内部权重。

随着ChatGPT等生成式AI产品的发展，基础模型的参数不断增加，因此进行权重调优需要耗费大量时间和算力。为提升调优效率，该方法可以在解码时更好地保留训练知识，同时保留更大规模预训练的优势。研究人员对LlAMA-2的13B、70B原始模型进行了微调，结果显示代理调优的性能比直接调优的模型更高。

论文地址:https://arxiv.org/pdf/2401.08565.pdf

该方法需要准备一个小型的预训练语言模型M-，与基础模型M共享相同的词汇表，然后使用训练数据对M-进行调优得到调优模型M+。

在解码时，通过对比基础模型M的输出预测分布和调优模型M+的输出预测分布之间的差异，来引导基础模型的预测，最后将预测差异应用于基础模型的预测结果，以引导基础模型的预测朝向调优模型的预测方向移动。这一方法与大模型中的“蒸馏”技术恰恰相反，是一种创新性的调优方法。

代理调优方法的推出，为大模型的调优提供了更高效的解决方案，同时也可以在解码时更好地保留训练知识，使得模型的性能更高。这一方法的推出将为AI领域的发展带来新的启示，值得进一步深入研究和应用。

ChatGPT源码推荐：小狐狸ChatGPT付费创作系统完全开源源码

思必驰智能语音携手茅台，打造“国酒级”AI大模型智能会议方案

2024-12-117965阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

华盛顿大学推高效大模型调优方法“代理调优”

推荐关键词

24小时热搜

大家正在看

大模型拿单江湖

AI大模型时代，人才的需求已经变了

2024，大模型杀进“决赛圈”

当做应用成为共识，大模型公司拿出了更多弹药

50多款AI眼镜来了，大模型找到了应用救星？

AI日报：阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字；腾讯发布混元视频生成大模型

大模型混战这一年：进化之赛、效率之争、落地之战

一手实测豆包新发布的视觉理解大模型，他们真的卷起飞了。

大模型创业“生死局”：融资困难、造血乏力、卖身离场

刚刚，沈向洋官宣通用视觉大模型！无需提示，就能识别万物

OpenAI发布强化微调API，能深度定制超复杂大模型了

华为盘古汽车大模型夺得第一 300+家车企都选它

周鸿祎：AGI发展遇瓶颈智能体和专业大模型将扛大旗

视觉中国与生数科技共拓视觉产业大模型应用

重磅！OpenAI发布满血o1、无限使用，最强大模型来了

百度大模型又拿了个冠军！全部8个维度均第一、7项满分

谷歌史上最强大模型！Gemini 2.0正式发布

思必驰智能语音携手茅台，打造“国酒级”AI大模型智能会议方案

灰豚AI数字人重磅突破，国内最强数字人AI口播软件大模型来袭

谷歌“狙击”OpenAI，发布新一代大模型，主打Agent+多模态

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

华盛顿大学推高效大模型调优方法“代理调优”

推荐关键词

24小时热搜

大家正在看

大模型拿单江湖

AI大模型时代，人才的需求已经变了

2024，大模型杀进“决赛圈”

当做应用成为共识，大模型公司拿出了更多弹药

50多款AI眼镜来了，大模型找到了应用救星？

AI日报：阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字；腾讯发布混元视频生成大模型

大模型混战这一年： 进化之赛、效率之争、落地之战

一手实测豆包新发布的视觉理解大模型，他们真的卷起飞了。

大模型创业“生死局”：融资困难、造血乏力、卖身离场

刚刚，沈向洋官宣通用视觉大模型！无需提示，就能识别万物

OpenAI发布强化微调API，能深度定制超复杂大模型了

华为盘古汽车大模型夺得第一 300+家车企都选它

周鸿祎：AGI发展遇瓶颈 智能体和专业大模型将扛大旗

视觉中国与生数科技共拓视觉产业大模型应用

重磅！OpenAI发布满血o1、无限使用，最强大模型来了

百度大模型又拿了个冠军！全部8个维度均第一、7项满分

谷歌史上最强大模型！Gemini 2.0正式发布

思必驰智能语音携手茅台，打造“国酒级”AI大模型智能会议方案

灰豚AI数字人重磅突破，国内最强数字人AI口播软件大模型来袭

谷歌“狙击”OpenAI，发布新一代大模型，主打Agent+多模态

大模型混战这一年：进化之赛、效率之争、落地之战

周鸿祎：AGI发展遇瓶颈智能体和专业大模型将扛大旗