Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

站长之家(ChinaZ.com) 8月24日消息:Nvidia 和 Mistral AI 发布了一款新型的小型语言模型，据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B，是 NeMo 12B 的迷你版本，参数量从 120 亿缩减到了 80 亿。

英伟达

据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍，这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中，团队在一个较小的数据集上重新训练了这个经过剪枝的模型，从而大幅提高了因剪枝导致的准确性下降。」

这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型，从而在计算成本上节省高达 40 倍。通常情况下，AI 模型需要在模型规模和准确性之间进行权衡，但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术，语言模型可以同时兼顾这两者。

配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B，使其比云服务更快且更安全。

Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务，并针对低延迟进行了优化，以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry，将 Minitron 8B 调整为能够在低配置设备（如智能手机）上运行。尽管性能和准确性可能略有下降，但 Nvidia 表示该模型仍然是高准确性的语言模型，并且只需极少的训练数据和计算资源。

剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上，开发者可以将这些优化技术应用于所有现有的语言模型，从而显著提升整体性能，包括那些只能由 AI 加速服务器群组运行的大型语言模型。

面向AI PC与嵌入式智能设备，江波龙AIDIMM™、AILPBGA™打造差异化内存方案

2026-07-272.6万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

推荐关键词

24小时热搜

大家正在看

国产单机《古剑》线下试玩，技嘉GeForce RTX 5080 整机及NVIDIA DLSS 4.5呈现国风盛宴

智微智能将同步上市基于NVIDIA Jetson T3000 /T2000模组的产品矩阵

海尔小优智能体升级亮相世界人工智能大会

招生季丨智领时代，技拓新局——湘南幼专人工智能技术应用专业

WAIC不筹量子重磅发布“量筹一号”——原子量子人工智能基座

为什么海尔智家能承建国家人工智能应用中试基地？

聚焦AI系统性进化腾讯发布2026人工智能十大趋势报告

GOAI 世界人工智能开源大赛四大赛道正式发布

GOAI 世界人工智能开源大赛官网上线，全球报名正式开启

Token聚力，智启新生｜天罡智算第三届人工智能与智算发展论坛盛大启幕

万佑智算 VanorOS 亮相2026世界人工智能大会，开启全民公测

锚定自贸港AI发展新坐标，卓世科技全球人工智能创新研发中心正式揭牌

WAIC 2026落幕，周鸿祎作为安全行业唯一嘉宾谈人工智能发展与安全

走进世界人工智能大会 RT-Thread睿赛德携开源AIOS联盟共筑端侧AI新生态

首发 | “龙虾出行”达成与华为、OPPO、vivo、小米、中兴等5家人工智能服务备案厂商合作

JUST.FOTO亮相2026 世界人工智能大会：现场验证AI影像体验，拓展线下商业新场景

机械革命亮相世界人工智能大会（WAIC）！多款高性能笔记本通过国家终端智能化L3等级认证

荣获2026福布斯中国人工智能科技企业TOP 50！讯飞AI眼镜以轻量智能终端链接世界

面向AI PC与嵌入式智能设备，江波龙AIDIMM™、AILPBGA™打造差异化内存方案

AI日报：开源模型Kimi K3登场；Google Vids引入Gemini Omni模型；智谱AI冲击10亿美元ARR

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

推荐关键词

24小时热搜

大家正在看

国产单机《古剑》线下试玩，技嘉GeForce RTX 5080 整机及NVIDIA DLSS 4.5呈现国风盛宴

智微智能将同步上市基于NVIDIA Jetson T3000 /T2000模组的产品矩阵

海尔小优智能体升级亮相世界人工智能大会

招生季丨智领时代，技拓新局——湘南幼专人工智能技术应用专业

WAIC不筹量子重磅发布“量筹一号”——原子量子人工智能基座

为什么海尔智家能承建国家人工智能应用中试基地？

聚焦AI系统性进化 腾讯发布2026人工智能十大趋势报告

GOAI 世界人工智能开源大赛 四大赛道正式发布

GOAI 世界人工智能开源大赛官网上线，全球报名正式开启

Token聚力，智启新生｜天罡智算第三届人工智能与智算发展论坛盛大启幕

万佑智算 VanorOS 亮相2026世界人工智能大会，开启全民公测

锚定自贸港AI发展新坐标，卓世科技全球人工智能创新研发中心正式揭牌

WAIC 2026落幕，周鸿祎作为安全行业唯一嘉宾谈人工智能发展与安全

走进世界人工智能大会 RT-Thread睿赛德携开源AIOS联盟共筑端侧AI新生态

首发 | “龙虾出行”达成与华为、OPPO、vivo、小米、中兴等5家人工智能服务备案厂商合作

JUST.FOTO亮相2026 世界人工智能大会：现场验证AI影像体验，拓展线下商业新场景

机械革命亮相世界人工智能大会（WAIC）！多款高性能笔记本通过国家终端智能化L3等级认证

荣获2026福布斯中国人工智能科技企业TOP 50！讯飞AI眼镜以轻量智能终端链接世界

面向AI PC与嵌入式智能设备，江波龙AIDIMM™、AILPBGA™打造差异化内存方案

AI日报：开源模型Kimi K3登场；Google Vids引入Gemini Omni模型；智谱AI冲击10亿美元ARR

聚焦AI系统性进化腾讯发布2026人工智能十大趋势报告

GOAI 世界人工智能开源大赛四大赛道正式发布