微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

划重点:
⭐️ 可将大模型体量压缩25% 左右，性能保持不变。
⭐️ SliceGPT 利用计算不变性简化和压缩模型。
⭐️ 切片操作后的模型可以在消费级显卡上运行，无需额外代码优化。

站长之家（ChinaZ.com）2月11日消息:微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT，该技术可以极限压缩大模型的权重矩阵，将模型体量压缩25% 左右，同时保持性能不变。实验数据显示，在保持零样本任务性能的情况下，SliceGPT 成功应用于多个大型模型，如 LLAMA-270B、OPT66B 和 Phi-2。

SliceGPT 的核心技术在于利用计算不变性来简化和压缩模型。通过对每个权重矩阵应用正交矩阵变换，SliceGPT 实现了对模型的极限压缩。此外，切片操作后的模型可以直接在消费级显卡上运行，如 N 卡的4090、4080，无需进行额外的代码优化，使得部署更加便捷。

在实验中，研究人员发现 SliceGPT 的切片技术非常简单高效，可以在几个小时内使用单个 GPU 完成模型压缩，无需复杂的细调过程。切片操作后的模型保持了高质量的生成任务性能，同时吞吐量得到提升，整体效果令人满意。

SliceGPT 的开源为压缩大模型提供了一种新颖且有效的途径，将大幅节省部署资源同时保持模型性能不变。这一技术的推出，有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。

开源地址:https://github.com/microsoft/TransformerCompression

论文地址:https://arxiv.org/abs/2401.15024

次元破壁！致态携吹雪&《凡人》动画双IP联名燃爆2026 BilibiliWorld

2026-07-106868阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

推荐关键词

24小时热搜

大家正在看

像真人聊天！OpenAI发布GPT-Live：AI可同步听与说

百度百舸AI Infra再升级，率先支持RLinf v0.3

LIGHT NUTS如何用AI重写电商内容规则？

无需NVLink，百度百舸AI Infra工程优化拉满 Cosmos 3 训练吞吐

LIGHT NUTS以AI内容引擎撬动电商视觉生产新变量

openKylin多项成果发布，全景展示AI开源生态布局

AI内容引擎LIGHT NUTS正在重新定义电商视觉生产

佰维存储BilibiliWorld 2026圆满收官

LIGHTNUTS深耕AIGC七年:AI工具重构电商内容生产

BilibiliWorld 2026盛会来袭！掠夺者们，全员集结！

从图文生成到视频生成：LIGHT NUTS一站式AI工具解析

AI工具LIGHTNUTS深耕AIGC七年重塑电商内容生产力

微星BilibiliWorld 2026完美收官：龙魂铸传奇，新品耀全场

次元破壁！致态携吹雪&《凡人》动画双IP联名燃爆2026 BilibiliWorld

LIGHT NUTS以AI重构电商内容生产链撬动品效合一

UALink联盟Kurtis：开放Scale-Up互连加速构建可部署AI超节点

LIGHT NUTS以AI重构电商内容生产逻辑打造视觉创作新底座

LIGHT NUTS深耕AIGC赛道七年 AI内容创作引擎重塑电商内容生产力

比三折叠更难！三星卷轴屏Galaxy Z Slide计划量产：全球首发

AI日报：SpaceXAI推出“Opus级”大模型Grok4.5;阶跃星辰首款AI智能体手机即将发布；蚂蚁灵波开源 LingBot-Video

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

推荐关键词

24小时热搜

大家正在看

像真人聊天！OpenAI发布GPT-Live：AI可同步听与说

百度百舸AI Infra再升级，率先支持RLinf v0.3

LIGHT NUTS如何用AI重写电商内容规则？

无需NVLink，百度百舸AI Infra工程优化拉满 Cosmos 3 训练吞吐

LIGHT NUTS以AI内容引擎撬动电商视觉生产新变量

openKylin多项成果发布，全景展示AI开源生态布局

AI内容引擎LIGHT NUTS正在重新定义电商视觉生产

佰维存储BilibiliWorld 2026圆满收官

LIGHTNUTS深耕AIGC七年:AI工具重构电商内容生产

BilibiliWorld 2026盛会来袭！掠夺者们，全员集结！

从图文生成到视频生成：LIGHT NUTS一站式AI工具解析

AI工具LIGHTNUTS深耕AIGC七年 重塑电商内容生产力

微星BilibiliWorld 2026完美收官：龙魂铸传奇，新品耀全场

次元破壁！致态携吹雪&《凡人》动画双IP联名燃爆2026 BilibiliWorld

LIGHT NUTS以AI重构电商内容生产链 撬动品效合一

UALink联盟Kurtis：开放Scale-Up互连加速构建可部署AI超节点

LIGHT NUTS以AI重构电商内容生产逻辑 打造视觉创作新底座

LIGHT NUTS深耕AIGC赛道七年 AI内容创作引擎重塑电商内容生产力

比三折叠更难！三星卷轴屏Galaxy Z Slide计划量产：全球首发

AI日报：SpaceXAI推出“Opus级”大模型Grok4.5;阶跃星辰首款AI智能体手机即将发布；蚂蚁灵波开源 LingBot-Video

AI工具LIGHTNUTS深耕AIGC七年重塑电商内容生产力

LIGHT NUTS以AI重构电商内容生产链撬动品效合一

LIGHT NUTS以AI重构电商内容生产逻辑打造视觉创作新底座