Mozilla 让人们将 AI LLM 变成单文件可执行文件，简化大型语言模型的分发和运行

站长之家(ChinaZ.com) 12 月 5 日消息:供本地使用的 LLM（大型语言模型）通常作为一组权重分布在数 GB 文件中。这些软件不能直接单独使用，这通常使得它们比其他软件更难分发和运行。给定的模型也可能经历了更改和调整，如果使用不同的版本，则会导致不同的结果。

截屏2023-12-05 上午10.53.02.png

Mozilla 的创新团队最近发布了 llamafile，这是一种开源方法，用于将一组权重转换为单个可在六种不同操作系统（macOS、Windows、Linux、FreeBSD、OpenBSD 和 NetBSD）上运行的二进制文件，无需安装。这大大简化了大型语言模型（LLMs）的分发和运行，并确保特定版本的 LLM 保持一致性和可重现性。

这一成就离不开 [Justine Tunney] 的贡献，他是一次构建、多处运行框架 Cosmopolitan 的创造者。另一个主要部分是 llama.cpp，它在运行自托管 LLM 方面具有重要作用。

有一些使用 Mistral-7B、WizardCoder-Python-13B 和 LLaVA 1.5 LLMs 的示例二进制文件可供使用。需要注意的是，如果您使用的是 Windows 平台，只有 LLaVA 1.5 能运行，因为它是唯一一个符合 Windows 对可执行文件 4 GB 大小限制的模型。如果遇到问题，请查看「常见问题」列表以获取故障排除提示。

llamafile 的发布标志着在大型语言模型的分发和运行方面的进步。这不仅降低了使用这些模型的技术门槛，也使得开发者和研究人员能够更容易地在多种操作系统上使用这些强大的 AI 工具。

随着越来越多的 LLMs 的开发和应用，llamafile 提供了一个有效的解决方案，以确保这些模型的有效和一致的使用。

据了解，在这里提到的权重是指在机器学习和人工智能领域中的一个术语。在大型语言模型（LLMs，如 GPT-4）中，权重是模型在训练过程中学习到的参数，用来确定输入数据如何转换为输出结果。这些权重决定了模型如何解释和处理输入的数据。

因此，当说到 LLMs 通常以多个 Gigabyte 的文件形式分发一组权重时，意味着这些文件包含了模型在训练过程中学到的所有必要参数。这些权重文件本身不能直接使用，需要通过特定的软件框架或环境来加载和运行，这使得与其他类型的软件相比，它们的分发和运行更加复杂。

微软 CEO Nadella 称赞 DeepSeek，并将其提供给客户在 Azure AI Foundry 上使用

2025-01-301.1万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Mozilla 让人们将 AI LLM 变成单文件可执行文件，简化大型语言模型的分发和运行

推荐关键词

24小时热搜

大家正在看

三星Galaxy S25 Ultra采用行业首款抗反射玻璃陶瓷Corning® Gorilla® Armor 2

微软 CEO Nadella 称赞 DeepSeek，并将其提供给客户在 Azure AI Foundry 上使用

颠覆LLM格局，AI2新模型OLMo2，训练过程全公开，数据架构双升级

苹果宣布Apple Intelligence 4月新增多语言支持：简体中文在列

打造贴心的Galaxy AI伙伴三星Galaxy S25系列树立Galaxy手机新标杆

健康年货哪家强？燕教授为全家健康 “实力打 call”

全面支持iOS、鸿蒙！钉钉Callkit功能官宣上线：锁屏直接通话

Mistral、AI2 发布新的开源 LLMs：更小，更便宜

滚烫Deepseek一夜刀掉英伟达4万亿，除夕开源多模态新模型：7B超越DALL-E 3和StableDiffusion

苦等7年果粉欢呼！微信CallKitt功能意外回归：支持灵动岛显示

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

VLM—VLA!理想、元戎启行等率先发力智能化

Apple Intelligence占用空间暴涨，AI功能让存储和电池成负担

Foothill Ventures完成三期1.1亿美元募资，聚焦AI前沿科技投资

三星Galaxy旗舰新品即将揭晓新品登记活动现已开启

CES 2025:三星持续拓展“AI for All”愿景,致力于将AI融入日常生活中的方方面面

CES 2025:三星持续拓展“AI for All”愿景,致力于将AI融入日常生活中的方方面面

号称全球首款主动式AI眼镜！Halliday宣布在CES推全新智能眼镜

接连被开源项目curl、Prisma弃用，Rust语言遭遇水逆，网友：从狂热粉到后悔莫及

雷军立Flag!小米汽车剑指“公用桩充电之王”，百万充电桩入驻

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

Mozilla 让人们将 AI LLM 变成单文件可执行文件，简化大型语言模型的分发和运行

推荐关键词

24小时热搜

大家正在看

三星Galaxy S25 Ultra采用行业首款抗反射玻璃陶瓷Corning® Gorilla® Armor 2

微软 CEO Nadella 称赞 DeepSeek，并将其提供给客户在 Azure AI Foundry 上使用

颠覆LLM格局，AI2新模型OLMo2，训练过程全公开，数据架构双升级

苹果宣布Apple Intelligence 4月新增多语言支持：简体中文在列

打造贴心的Galaxy AI伙伴 三星Galaxy S25系列树立Galaxy手机新标杆

健康年货哪家强？燕教授为全家健康 “实力打 call”

全面支持iOS、鸿蒙！钉钉Callkit功能官宣上线：锁屏直接通话

Mistral、AI2 发布新的开源 LLMs：更小，更便宜

滚烫Deepseek一夜刀掉英伟达4万亿，除夕开源多模态新模型：7B超越DALL-E 3和StableDiffusion

苦等7年果粉欢呼！微信CallKitt功能意外回归：支持灵动岛显示

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

VLM—VLA!理想、元戎启行等率先发力智能化

Apple Intelligence占用空间暴涨，AI功能让存储和电池成负担

Foothill Ventures完成三期1.1亿美元募资，聚焦AI前沿科技投资

三星Galaxy旗舰新品即将揭晓 新品登记活动现已开启

CES 2025:三星持续拓展“AI for All”愿景,致力于将AI融入日常生活中的方方面面

CES 2025:三星持续拓展“AI for All”愿景,致力于将AI融入日常生活中的方方面面

号称全球首款主动式AI眼镜！Halliday宣布在CES推全新智能眼镜

接连被开源项目curl、Prisma弃用，Rust语言遭遇水逆，网友：从狂热粉到后悔莫及

雷军立Flag!小米汽车剑指“公用桩充电之王”，百万充电桩入驻

打造贴心的Galaxy AI伙伴三星Galaxy S25系列树立Galaxy手机新标杆

三星Galaxy旗舰新品即将揭晓新品登记活动现已开启