清华、哈工大提出OneBit方法：可把大模型压缩到1bit 保持 83% 性能

划重点:
⭐ 清华大学和哈尔滨工业大学联合发布论文，将大模型压缩到1bit，保持83% 性能;
⭐ OneBit 方法首次尝试1bit 量化，突破了2bit 的限制;
⭐ 新方法结合1bit 层结构、基于 SVID 的参数初始化和量化感知训练。

站长之家（ChinaZ.com）3月4日消息:近期，清华大学和哈尔滨工业大学联合发布了一篇论文，成功将大模型压缩到1bit，仍保持83% 的性能。这一成果标志着量化模型领域的一次重大突破。过去，2bit 以下的量化一直是研究人员难以逾越的障碍，而这次的1bit 量化尝试，引起了国内外学术界的广泛关注。

这项研究提出的 OneBit 方法，首次尝试将预训练大模型压缩到真正的1bit。通过全新的1bit 层结构、基于 SVID 的参数初始化和量化感知训练，成功将大模型参数压缩到1bit 表示。该方法不仅保留了模型的高精度和高秩，还能够在极大幅度压缩模型参数的同时，保证模型至少83% 的性能。

OneBit 方法的核心在于将权重矩阵压缩到1bit，并引入两个 FP16格式的值向量以弥补精度损失。通过新的参数初始化方法 SVID 和知识迁移，成功将高精度预训练模型的能力转移到1bit 量化模型上。实验结果表明，OneBit 方法相较于其他2bit 量化方法，在验证集困惑度和 Zero-shot 准确度上表现更为优秀。

该研究的意义在于，成功突破了2bit 量化的障碍，为在 PC 和智能手机上部署大模型提供了新的可能性。未来，随着技术的不断进步，将有望实现将大型语言模型等大模型压缩到极低位宽，并实现在移动设备上高效运行的愿景。

论文地址:https://arxiv.org/pdf/2402.11295.pdf

中聚AI女娲大模型：专注企业服务的智能AI，让企业难题一点就通！

2024-11-124576阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

清华、哈工大提出OneBit方法：可把大模型压缩到1bit 保持 83% 性能

推荐关键词

24小时热搜

大家正在看

大模型的苦，创业的AI 科学家最懂

思必驰AI办公本Turbo发布，大模型助力高效办公和知识管理

指令层级，帮助AI大模型防御恶意攻击

50多款AI眼镜来了，大模型找到了应用救星？

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

李彦宏最新发声：大模型基本消除幻觉 AI变得可用可信赖！

中聚AI女娲大模型：专注企业服务的智能AI，让企业难题一点就通！

AI日报：字节推AI模型社区平台炉米Lumi；神秘大模型“小熊猫”身份揭晓；ChatGPT高级语音模式登陆Mac

世界AI大会召开马上消金展示金融大模型安全实践成果丨马上消金

699元努比亚Watch GT发布：接入混元AI大模型

猿辅导集团副总裁程群：AI时代，大模型在教育场景的创新与应用

中聚AI女娲大模型:如何利用AI帮助企业提升核心竞争力?

努比亚Z70 Ultra首发星云AIOS：基于星辰AI大模型打造

大模型上了火山方舟：数据唯你可见，唯你所用，唯你所有

英伟达展示AI模型Fugatto：可修改并生成新声音

端到端大模型到底是个啥小米官方详解

大模型为何如此热衷投广告？只因用户的兴趣降低了

国产4o大模型，秒懂国风李子柒

刚刚，沈向洋官宣通用视觉大模型！无需提示，就能识别万物

大模型公司们创业未半，技术主心骨们却先弃船回大厂了？

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

​清华、哈工大提出OneBit方法：可把大模型压缩到1bit 保持 83% 性能

推荐关键词

24小时热搜

大家正在看

大模型的苦，创业的AI 科学家最懂

思必驰AI办公本Turbo发布，大模型助力高效办公和知识管理

指令层级，帮助AI大模型防御恶意攻击

50多款AI眼镜来了，大模型找到了应用救星？

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

李彦宏最新发声：大模型基本消除幻觉 AI变得可用可信赖！

中聚AI女娲大模型：专注企业服务的智能AI，让企业难题一点就通！

AI日报：字节推AI模型社区平台炉米Lumi；神秘大模型“小熊猫”身份揭晓；ChatGPT高级语音模式登陆Mac

世界AI大会召开 马上消金展示金融大模型安全实践成果丨马上消金

699元 努比亚Watch GT发布：接入混元AI大模型

猿辅导集团副总裁程群：AI时代，大模型在教育场景的创新与应用

中聚AI女娲大模型:如何利用AI帮助企业提升核心竞争力?

努比亚Z70 Ultra首发星云AIOS：基于星辰AI大模型打造

大模型上了火山方舟：数据唯你可见，唯你所用，唯你所有

英伟达展示AI模型Fugatto：可修改并生成新声音

端到端大模型到底是个啥 小米官方详解

大模型为何如此热衷投广告？只因用户的兴趣降低了

国产4o大模型，秒懂国风李子柒

刚刚，沈向洋官宣通用视觉大模型！无需提示，就能识别万物

大模型公司们创业未半，技术主心骨们却先弃船回大厂了？

清华、哈工大提出OneBit方法：可把大模型压缩到1bit 保持 83% 性能

世界AI大会召开马上消金展示金融大模型安全实践成果丨马上消金

699元努比亚Watch GT发布：接入混元AI大模型

端到端大模型到底是个啥小米官方详解