微软开发新型大模型压缩方法SliceGPT

站长之家（ChinaZ.com）1月29日消息:SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT，可以在保持99%，99%，和90%零样本任务性能的同时，将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数（包括嵌入）。

这意味着使用SLICE GPT的模型可以在更少的GPU上运行，并且运行速度更快，无需任何额外的代码优化。在24GB的消费级GPU上，将LLAMA2-70B的总计算量减少到密集模型的64%;在40GB的A100GPU上减少到66%。

论文地址:https://arxiv.org/pdf/2401.15024.pdf

SLICE GPT的主要特点包括解决了大语言模型在存储和计算资源上的高需求问题，并提供了一种有效减轻这些资源需求的方法，同时保持或仅轻微牺牲模型性能，这对于推广大型模型的应用和降低运行成本具有重要意义。

具体来说，SLICE GPT能够减少大型语言模型的尺寸，通过在不损失显著性能的前提下，减少模型参数数量，SLICE GPT能够减少大型语言模型的尺寸。它还能提高模型在硬件上的运行效率，减少了所需的计算资源，并且能够在去除一定比例的模型参数的同时，保持模型的性能。此外，SLICE GPT不仅适用于特定的模型或架构，它的方法可以广泛应用于各种变换器网络模型。

SLICE GPT的工作原理基于一种新的后训练稀疏化方案，通过两个关键步骤来减少大型语言模型的计算和内存需求。首先是替换权重矩阵，通过将模型中的每个权重矩阵替换为一个更小的（密集的）矩阵来减少网络的嵌入维度，有效地缩减了模型的大小。

其次是维持计算不变性，SLICE GPT引入了变换器网络中的“计算不变性”概念，通过特定的变换操作，改变权重矩阵的形状，而不改变其在模型中的功能和影响，从而达到减少模型参数的目的，同时保持模型的性能。这种方法的核心优势在于，它允许模型在去除一定比例的参数后，仍然能够保持接近原始模型的性能，适用于资源受限的设备上部署大型模型，比如普通的个人电脑或者移动设备。

素力高Solid Gold公益捐赠超百万营养物资，携六城领养日守护流浪毛孩！

2026-07-302.0万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

微软开发新型大模型压缩方法SliceGPT

推荐关键词

24小时热搜

大家正在看

国产黑暗武侠3A大作过审！《影之刃零》登陆WeGame开启预约

佰维存储BilibiliWorld 2026圆满收官

BilibiliWorld 2026盛会来袭！掠夺者们，全员集结！

微星BilibiliWorld 2026完美收官：龙魂铸传奇，新品耀全场

次元破壁！致态携吹雪&《凡人》动画双IP联名燃爆2026 BilibiliWorld

像真人聊天！OpenAI发布GPT-Live：AI可同步听与说

百度百舸AI Infra再升级，率先支持RLinf v0.3

无需NVLink，百度百舸AI Infra工程优化拉满 Cosmos 3 训练吞吐

雕妹联名来袭！B850 AORUS ELITE-P ICE 主板首发特典活动开启

三星Galaxy Z Fold/Flip8全系单卡+eSIM：港版无法入网

中东低空经济提速！阿布扎比首款自研无人货机“Hili”启动适航认证

素力高Solid Gold公益捐赠超百万营养物资，携六城领养日守护流浪毛孩！

理想AI眼镜Livis升级：接入小红书Agent 逛街不用掏手机

华为耳机联动豆包功能全量上线：支持FreeClip 2、FreeBuds Pro 5

骁龙7系无Elite/至尊，从一加Ace 3V看骁龙7+ Gen3的硬实力

1770元华为FreeClip 2S全球发布：自研NPU 算力提升10倍

UALink联盟Kurtis：开放Scale-Up互连加速构建可部署AI超节点

蚂蚁灵波定义视频生成第二赛道，开源LingBot-Video，融合7万小时具身数据

三星Galaxy Z Flip8小折叠发布：售价8999元起

突破具身智能泛化瓶颈！支持20多种机器人构型，蚂蚁灵波开源具身基座模型LingBot-VLA 2.0

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

微软开发新型大模型压缩方法SliceGPT

推荐关键词

24小时热搜

大家正在看

国产黑暗武侠3A大作过审！《影之刃零》登陆WeGame开启预约

佰维存储BilibiliWorld 2026圆满收官

BilibiliWorld 2026盛会来袭！掠夺者们，全员集结！

微星BilibiliWorld 2026完美收官：龙魂铸传奇，新品耀全场

次元破壁！致态携吹雪&《凡人》动画双IP联名燃爆2026 BilibiliWorld

像真人聊天！OpenAI发布GPT-Live：AI可同步听与说

百度百舸AI Infra再升级，率先支持RLinf v0.3

无需NVLink，百度百舸AI Infra工程优化拉满 Cosmos 3 训练吞吐

雕妹联名来袭！B850 AORUS ELITE-P ICE 主板首发特典活动开启

三星Galaxy Z Fold/Flip8全系单卡+eSIM：港版无法入网

中东低空经济提速！阿布扎比首款自研无人货机“Hili”启动适航认证

素力高Solid Gold公益捐赠超百万营养物资，携六城领养日守护流浪毛孩！

理想AI眼镜Livis升级：接入小红书Agent 逛街不用掏手机

华为耳机联动豆包功能全量上线：支持FreeClip 2、FreeBuds Pro 5

骁龙7系无Elite/至尊，从一加Ace 3V看骁龙7+ Gen3的硬实力

1770元 华为FreeClip 2S全球发布：自研NPU 算力提升10倍

UALink联盟Kurtis：开放Scale-Up互连加速构建可部署AI超节点

蚂蚁灵波定义视频生成第二赛道，开源LingBot-Video，融合7万小时具身数据

三星Galaxy Z Flip8小折叠发布：售价8999元起

突破具身智能泛化瓶颈！支持20多种机器人构型，蚂蚁灵波开源具身基座模型LingBot-VLA 2.0

1770元华为FreeClip 2S全球发布：自研NPU 算力提升10倍