站长之家 - 业界 2023-11-10 14:32

Intel研究人员提出新AI方法，更高效地在CPU上部署LLM

**划重点:**
- 🌐 大型语言模型（LLM）因在文本生成、语言理解和文本摘要等任务中的卓越表现而备受欢迎，但其庞大的模型参数却需要大量内存和专用硬件。
- 🧮 为了降低推断所需的计算功率，Intel的研究人员提出了一种有效的方法，支持自动的INT-4权重量化流程，可以在CPU上高效部署LLM。
- ⚙️ 他们还设计了一个特定的LLM运行时，具有高度优化的内核，加速CPU上的推断过程。

站长之家(ChinaZ.com) 11月10日消息:大型语言模型（LLM）因其在文本生成、语言理解和文本摘要等各种任务中的卓越性能而备受瞩目，但它们庞大的模型参数却需要大量内存和专用硬件，这使得部署这些模型变得相当具有挑战性。

为了降低推断所需的计算功率，研究人员通常采用权重量化等方法，即减少人工神经网络的权重和激活函数的精度。其中，INT8和仅权重量化是一些改进推断成本的方法。然而，这些方法通常针对CUDA进行优化，可能不适用于CPU。

英特尔

Intel研究人员提出了一种有效的方法，可以在CPU上高效部署LLM。他们的方法支持自动的INT-4仅权重量化流程，即将低精度应用于模型的权重，而将激活函数的精度保持较高。此外，他们设计了一个特定的LLM运行时，具有高度优化的内核，可以加速CPU上的推断过程。

他们的权重量化流程基于Intel神经压缩器，并允许在不同的量化配方、粒度和组大小上进行调整，以生成满足准确性目标的INT4模型。然后，将模型传递给LLM运行时，这是一个专门设计用于评估量化模型性能的环境。该运行时已经设计用于在CPU上高效推断LLM。

在他们的实验中，研究人员选择了一些参数大小不同的流行LLM，范围从7B到20B。他们使用开源数据集评估了FP32和INT4模型的性能。他们观察到，在所选数据集上，量化模型的准确性几乎与FP32模型相当。此外，他们对下一个标记生成的延迟进行了比较分析，并发现LLM运行时比ggml-based解决方案性能提高了多达1.6倍。

研究论文提出了解决LLM推断在CPU上的一个最大挑战的方法。传统上，这些模型需要像GPU这样的专用硬件，这使它们对许多组织来说不可及。这篇论文提出了INT4模型量化以及专门的LLM运行时，以在CPU上高效推断LLM。

在一组流行的LLM上进行评估时，该方法表现出比ggml-based解决方案更具优势，并且在准确性上与FP32模型相当。然而，还有进一步改进的空间，研究人员计划推动在个人计算机上实现生成式人工智能，以满足对人工智能生成内容不断增长的需求。

项目网址：https://github.com/intel/intel-extension-for-transformers

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Intel研究人员提出新AI方法，更高效地在CPU上部署LLM

推荐关键词

24小时热搜

大家正在看

大厂VP做自媒体翻车带来的思考！

媲美Suno、Udio！AI铁了心，要砸音乐人的饭碗

《蛋仔派对》多措并举，助力玩家远离网络诈骗危害

OpenBuddy发布新一代中文跨语言大模型基于Llama 3 70B打造

抖音：开展“同质化网络水军”专项治理

一斤70元荔枝自由要没了：暴雨频繁导致产量减少

大妈地铁上拿麦克风放声高唱官方：将加强巡逻监管

谁来接替库克苹果的下一任CEO浮出水面

安卓千元机爆款！荣耀X50宣布累计销量破1000万台

moto X50 Ultra官宣：moto首款AI旗舰

螺蛳粉有官方英文名了：正式命名为“Liuzhou Luosifen”

电视剧新生专治恋爱脑：提醒人们在爱情中保持警惕

这项链戴上根本不敢咳嗽：女子晒出“特别”项链

怡宝透明包装是酒店加油站专供：网上和超市暂时无法买到

公司回应请“山寨周杰伦”代言：正处于试生产试销阶段

诺基亚复古备机回归：诺基亚3210 4G售价349元

你用过哪些诺基亚手机！诺基亚复古备机回归不少用户为情怀下单

周鸿祎谈璩静事件：企业打造IP交学费在所难免

华为官网更新余承东简介：华为终端BG CEO变更为董事长

卢伟冰介绍两位小米新上任女高管：在小米遇困难时都会挺身而出

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Intel研究人员提出新AI方法，更高效地在CPU上部署LLM

推荐关键词

24小时热搜

大家正在看

大厂VP做自媒体翻车带来的思考！

媲美Suno、Udio！AI铁了心，要砸音乐人的饭碗

《蛋仔派对》多措并举，助力玩家远离网络诈骗危害

OpenBuddy发布新一代中文跨语言大模型 基于Llama 3 70B打造

抖音：开展“同质化网络水军”专项治理

一斤70元 荔枝自由要没了：暴雨频繁导致产量减少

大妈地铁上拿麦克风放声高唱 官方：将加强巡逻监管

谁来接替库克 苹果的下一任CEO浮出水面

安卓千元机爆款！荣耀X50宣布累计销量破1000万台

moto X50 Ultra官宣：moto首款AI旗舰

螺蛳粉有官方英文名了：正式命名为“Liuzhou Luosifen”

电视剧新生专治恋爱脑：提醒人们在爱情中保持警惕

这项链戴上根本不敢咳嗽：女子晒出“特别”项链

怡宝透明包装是酒店加油站专供：网上和超市暂时无法买到

公司回应请“山寨周杰伦”代言：正处于试生产试销阶段

诺基亚复古备机回归：诺基亚3210 4G售价349元

你用过哪些诺基亚手机！诺基亚复古备机回归 不少用户为情怀下单

周鸿祎谈璩静事件：企业打造IP交学费在所难免

华为官网更新余承东简介：华为终端BG CEO变更为董事长

卢伟冰介绍两位小米新上任女高管：在小米遇困难时都会挺身而出

OpenBuddy发布新一代中文跨语言大模型基于Llama 3 70B打造

一斤70元荔枝自由要没了：暴雨频繁导致产量减少

大妈地铁上拿麦克风放声高唱官方：将加强巡逻监管

谁来接替库克苹果的下一任CEO浮出水面

你用过哪些诺基亚手机！诺基亚复古备机回归不少用户为情怀下单