AMD发布AI小语言模型：6900亿token、推测解码提速3.88倍

AMD推出小语言模型，赋能企业个性化部署

AMD发布首个小语言模型，增强企业部署灵活性

近日，AMD推出了其首个小语言模型（SLM），名为“AMD-135M”。相较于体积庞大的大语言模型（LLM），AMD-135M更加小巧灵活，并具备针对性，非常适合具有高私密性和专业性的企业部署。

AMD-135M小语言模型概览

AMD-135M小模型属于Llama家族，共有两个版本：

基础型AMD-Llama-135M：拥有6700亿个token，在八块Instinct MIM250 64GB加速器上训练六天。
扩展型AMD-Llama-135M-code：额外增加了200亿个针对编程的token，在相同硬件上训练四天。

推测解码：提升性能，降低内存占用

AMD-135M小模型采用了一种称为“推测解码”的方法。该方法通过较小的草稿模型，在一个前向传播中生成多个候选token，然后发送给更大的、更精确的目标模型进行验证或纠正。这种方法允许同时生成多个token，而不影响性能。此外，它还可以降低内存占用，但由于数据交易量增加，功耗也会随之增加。 AMD利用AMD-Llama-135M-code作为CodeLlama-7b的草稿模型，测试了推测解码的使用效果。

在MI250加速器上，性能提升最高可达2.8倍。
在锐龙AI CPU上，性能提升最高可达3.88倍。
在锐龙AI NPU上，性能提升最高可达2.98倍。

开源资源，促进模型开发

AMD-135M小模型的训练代码、数据集等资源均已开源，遵循Apache 2.0协议。企业和开发者可以根据自己的特定需求和应用场景进行定制和优化。

性能与其他小语言模型的对比

根据AMD的说法，AMD-135M小模型的性能与其他开源小语言模型基本相当或略有领先。在某些任务上，如Hellaswag和SciQ，它甚至超过了Llama-68M和LLama-160M。而在Hellaswag、WinoGrande、SciQ、MMLU和ARC-Easy等其他任务上，其性能与GTP2-124MN和OPT-125M类似。 AMD-135M小语言模型为企业提供了灵活且强大的工具，可以根据其独特需求和业务目标进行定制化部署。其开源特性和与其他模型类似的性能，使其成为企业探索人工智能和语言处理应用的理想选择。

国产版劳斯莱斯！鸿蒙智行尊界S800亮相：星汉灿烂大灯、星空顶上车

2024-11-261.7万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AMD发布AI小语言模型：6900亿token、推测解码提速3.88倍

AMD发布首个小语言模型，增强企业部署灵活性

AMD-135M小语言模型概览

推测解码：提升性能，降低内存占用

开源资源，促进模型开发

性能与其他小语言模型的对比

推荐关键词

24小时热搜

大家正在看

全新HUAWEI MatePad Pro 13.2 英寸，旗舰鸿蒙平板首发亮相

Goodview荣获2024年中国消费品最佳创新实践案例，赋能消费品行业创新智慧发展

HUAWEI Mate系列旗舰新品发布：小艺再进阶解锁更多创新AI功能

华为与支付宝联合优化 Mate 70碰一下支付比其他手机更快

“中国天眼”发现脉冲星超过1000颗！超过全球同行的总和

百度大模型又拿了个冠军！全部8个维度均第一、7项满分

全行业第一家！理想“车位到车位”智驾将于11月28日推送

瑞银中国汽车行业研究主管巩旻：新一轮车企“价格战”或在2025年1月打响

RTX 5090D和原版5090硬件没有差别！和4090D刀法截然不同

苹果供应商投资OLED：新一代MacBook Pro蓄势待发

AZZA推出DIAMOND机箱：外形似钻石、支持ATX主板

强得起飞到100！华为MATE商标已注册到MATE100

BIT交易所年底推出双重优惠活动，总奖池超过 60,000 USDT

三星Galaxy S25 Ultra真机首曝：边框更窄钛灰色机身满满科技感

94岁巴菲特公布后事安排：只留0.5%个人财富给孩子剩下全捐赠

余承东果然是造词鬼才！强的飞起、那四个字、没有未来谁才是Mate70发布会最火金句

发布不实信息被大量转载！搜狐娱乐向刘强东章泽天夫妇致歉

余承东：有朋友直接微信转账了6万给我要订3台尊界S800

300多万人已预约！华为Mate 70开售倒计时：5499元起手慢无

国产版劳斯莱斯！鸿蒙智行尊界S800亮相：星汉灿烂大灯、星空顶上车

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AMD发布AI小语言模型：6900亿token、推测解码提速3.88倍

AMD发布首个小语言模型，增强企业部署灵活性

AMD-135M小语言模型概览

推测解码：提升性能，降低内存占用

开源资源，促进模型开发

性能与其他小语言模型的对比

推荐关键词

24小时热搜

大家正在看

全新HUAWEI MatePad Pro 13.2 英寸，旗舰鸿蒙平板首发亮相

Goodview荣获2024年中国消费品最佳创新实践案例，赋能消费品行业创新智慧发展

HUAWEI Mate系列旗舰新品发布：小艺再进阶解锁更多创新AI功能

华为与支付宝联合优化 Mate 70碰一下支付比其他手机更快

“中国天眼”发现脉冲星超过1000颗！超过全球同行的总和

百度大模型又拿了个冠军！全部8个维度均第一、7项满分

全行业第一家！理想“车位到车位”智驾将于11月28日推送

瑞银中国汽车行业研究主管巩旻：新一轮车企“价格战”或在2025年1月打响

RTX 5090D和原版5090硬件没有差别！和4090D刀法截然不同

苹果供应商投资OLED：新一代MacBook Pro蓄势待发

AZZA推出DIAMOND机箱：外形似钻石、支持ATX主板

强得起飞到100！华为MATE商标已注册到MATE100

BIT交易所年底推出双重优惠活动，总奖池超过 60,000 USDT

三星Galaxy S25 Ultra真机首曝：边框更窄 钛灰色机身满满科技感

94岁巴菲特公布后事安排：只留0.5%个人财富给孩子 剩下全捐赠

余承东果然是造词鬼才！强的飞起、那四个字、没有未来 谁才是Mate70发布会最火金句

发布不实信息被大量转载！搜狐娱乐向刘强东章泽天夫妇致歉

余承东：有朋友直接微信转账了6万给我要订3台尊界S800

300多万人已预约！华为Mate 70开售倒计时：5499元起 手慢无

国产版劳斯莱斯！鸿蒙智行尊界S800亮相：星汉灿烂大灯、星空顶上车

三星Galaxy S25 Ultra真机首曝：边框更窄钛灰色机身满满科技感

94岁巴菲特公布后事安排：只留0.5%个人财富给孩子剩下全捐赠

余承东果然是造词鬼才！强的飞起、那四个字、没有未来谁才是Mate70发布会最火金句

300多万人已预约！华为Mate 70开售倒计时：5499元起手慢无