清华提出4比特优化器显著减少LLaMA微调的显存需求

要点:
1、针对优化器状态的量化方法，将优化器状态的数值精度降低至4比特
2、提出了针对一阶矩和二阶矩的量化策略，处理了零点问题等难点
3、在多个微调任务中达到全精度优化器的性能，同时可将LLaMA微调的显存需求减少超过50%

站长之家（ChinaZ.com）9月8日消息:随着大模型规模的不断增大，显存需求成为模型训练的主要瓶颈之一。优化器状态中的一阶矩和二阶矩是占用大量显存的重要因素。为降低显存使用，清华大学朱军、陈键飞团队在ICLR2022的工作基础上，进一步将优化器状态的比特数降低到4比特，同时针对一阶矩和二阶矩的不同特点，提出了相应的量化策略。

项目地址:https://github.com/thu-ml/low-bit-optimizers

对于一阶矩，由于存在按行或列分布的异常值，提出采用更小的128大小的分块进行归一化。对二阶矩，确定零点问题是主要难点，去除零点的线性映射取得了很好效果，同时提出rank-1归一化更好地处理异常值。最后，提出了4比特AdamW和Factor两种低精度优化器。

在多个经典的微调任务中进行评估，结果表明4比特优化器能够匹配甚至超过32比特AdamW的性能。同时显著减少了优化器状态的显存需求，在LLaMA-7B的微调中最高可节省57.7%的显存。提供了开箱即用的PyTorch接口，只需要一行代码即可使用。

本研究工作展示了通过压缩的思路显著减少大模型微调中的显存瓶颈的可能性。同时优化器状态的低比特设计也为进一步探索内存高效的训练算法提供了有价值的经验。这些成果将促进大模型在有限硬件条件下的高效训练与应用。

延迟降低2倍！英特尔披露至强6处理器针对Meta Llama 3模型的推理性能

2024-04-201.5万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

清华提出4比特优化器显著减少LLaMA微调的显存需求

推荐关键词

24小时热搜

大家正在看

Gorq推出iOS应用支持Llama3、Gemma等

阿里云推出针对Llama 3系列模型限时免费训练、部署、推理服务

最强大模型Llama 3正式发布已达GPT4级别

Ollama更新优化软件并支持Command R+等多个热门模型

阿里云宣布全方位支持Llama 3训练推理帮助开发者构建自己的大模型

百度智能云宣布支持Llama3全系列训练推理

Llama 3突然来袭！开源社区再次沸腾：GPT-4级别模型可以自由访问的时代到来

Meta计划下周推Llama3基础版，夏季推出全面版

Meta新大语言模型LLama 3将在英特尔和高通硬件上运行

Meta即将推出新一代Llama3大语言模型

Llama 3官网体验入口 Meta最新开源语言模型免费使用地址

ChatGPT平替！本地部署Llama2 ，贝锐花生壳3步远程访问

OpenAI针对API客户引入更多企业级AI功能，与Meta的Llama 3竞争

Llama 3每秒输出800个token逼宫openAI！下周奥特曼生日或放出GPT-5？

中文聊天模型Llama3-8B-Chinese-Chat发布减少中英混答的问题

Llama 3超大杯有何惊喜？Meta会一直开源吗？当初为何笃信元宇宙？扎克伯格新访谈回应一切

全球首个「开源GPT-4」出世！Llama 3震撼发布，Meta AI免登录可用

1320亿参数，性能超LLaMA2、Grok-1！开源大模型DBRX

延迟降低2倍！英特尔披露至强6处理器针对Meta Llama 3模型的推理性能

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

清华提出4比特优化器 显著减少LLaMA微调的显存需求

推荐关键词

24小时热搜

大家正在看

Gorq推出iOS应用 支持Llama3、Gemma等

阿里云推出针对Llama 3系列模型限时免费训练、部署、推理服务

最强大模型Llama 3正式发布 已达GPT4级别

Ollama更新 优化软件并支持Command R+等多个热门模型

阿里云宣布全方位支持Llama 3训练推理 帮助开发者构建自己的大模型

百度智能云宣布支持Llama3全系列训练推理

Llama 3突然来袭！开源社区再次沸腾：GPT-4级别模型可以自由访问的时代到来

​Meta计划下周推Llama3基础版，夏季推出全面版

Meta新大语言模型LLama 3将在英特尔和高通硬件上运行

Meta即将推出新一代Llama3大语言模型

Llama 3官网体验入口 Meta最新开源语言模型免费使用地址

ChatGPT平替！本地部署Llama2 ，贝锐花生壳3步远程访问

​OpenAI针对API客户引入更多企业级AI功能，与Meta的Llama 3竞争

Llama 3每秒输出800个token逼宫openAI！下周奥特曼生日或放出GPT-5？

中文聊天模型Llama3-8B-Chinese-Chat发布 减少中英混答的问题

Llama 3超大杯有何惊喜？Meta会一直开源吗？当初为何笃信元宇宙？扎克伯格新访谈回应一切

全球首个「开源GPT-4」出世！Llama 3震撼发布，Meta AI免登录可用

1320亿参数，性能超LLaMA2、Grok-1！开源大模型DBRX

延迟降低2倍！英特尔披露至强6处理器针对Meta Llama 3模型的推理性能

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

清华提出4比特优化器显著减少LLaMA微调的显存需求

Gorq推出iOS应用支持Llama3、Gemma等

最强大模型Llama 3正式发布已达GPT4级别

Ollama更新优化软件并支持Command R+等多个热门模型

阿里云宣布全方位支持Llama 3训练推理帮助开发者构建自己的大模型

Meta计划下周推Llama3基础版，夏季推出全面版

OpenAI针对API客户引入更多企业级AI功能，与Meta的Llama 3竞争

中文聊天模型Llama3-8B-Chinese-Chat发布减少中英混答的问题