站长之家用户 - 传媒 2024-07-29 09:16

GPUStack正式发布: 为大模型而生的开源GPU集群管理器

7月26日，数澈软件Seal（以下简称“Seal”）宣布正式发布并开源比较新产品 GPUStack，GPUStack 是一个用于运行 LLM（大型语言模型）的开源 GPU 集群管理器。

尽管如今大语言模型作为公共的云上服务已经被广泛推广并在公有云上变得更加易于使用，但对企业来说，部署托管自己私有的 LLM 供企业和组织在私有环境使用仍然非常复杂。

首先，企业需要安装和管理复杂的集群软件，如 Kubernetes，然后还需要研究清楚如何在上层安装和管理 AI 相关的工具栈。而目前流行的能在本地环境运行 LLM 的方法，如 LMStudio 和 LocalAI，却大都只支持在单台机器上运行，而没有提供多节点复杂集群环境的支持能力。

Seal 联合创始人及 CTO 梁胜博士介绍道，“GPUStack 支持基于任何品牌的异构 GPU 构建统一管理的算力集群，无论目标 GPU 运行在 Apple Mac、Windows PC 还是 Linux 服务器上， GPUStack 都能统一纳管并形成统一算力集群。GPUStack 管理员可以从诸如 Hugging Face 等流行的大语言模型仓库中轻松部署任意 LLM。进而，开发人员则可以像访问 OpenAI 或 Microsoft Azure 等供应商提供的公有 LLM 服务的 API 一样，非常简便地调用 OpenAI 兼容的 API 访问部署就绪的私有 LLM。”

帮助企业简单快速地开启 LLM 创新

当前，企业如果想要在 GPU 集群上托管大模型，必须要做大量的工作来集成复杂的技术栈。通过使用 GPUStack，企业不再需要担心如何管理 GPU 集群、推理引擎和推理加速、租户和配额管理、使用和计量、性能度量、统一认证授权和访问控制，以及仪表板。

如下图所示，GPUStack 是一个构建企业私有的大模型即服务（LLMaaS）的完整平台，拥有构建大模型即服务所需的各项功能。管理员可以将模型从 Hugging Face 等模型仓库部署到 GPUStack 中，然后开发人员可以连接到 GPUStack 提供的私有大模型 API，在他们的应用中集成和使用私有大模型服务。

“随着大语言模型能力的逐渐提高，企业和组织一方面对快速进入 AI 时代充满了信心并满怀期待，希望大语言模型能尽快为自己的企业和组织带来生产效能的提高，而另一方面，对于能否有效地把如火如荼的大语言模型技术进一步与实际业务进行有机结合，是否能因此产生相应的效益，企业及团队又同时充满了疑问。我们希望通过简单易用的 GPUStack 平台，部署和运行各种开源大语言模型，提供 OpenAI 兼容的 API 接口，使得开发人员简单方便地访问任何的 LLM。” Seal 联合创始人及 CEO 秦小康介绍道，“最重要的是，我们支持 Nvidia，Intel，AMD 及众多品牌的 GPU，在支持异构 GPU 集群的同时能为企业节省更多成本。帮助企业简单快速地开启 LLM 创新是 GPUStack 团队的初心和使命。”

整合GPU资源运行大模型

组建 GPU 集群整合资源

GPUStack 可以聚合集群内的所有 GPU 资源。它旨在支持所有的 GPU 厂商，包括英伟达，苹果，AMD，英特尔，高通，华为等。GPUStack 兼容运行 MacOS、Windows 和 Linux 操作系统的笔记本电脑、台式机、工作站和服务器。

模型部署和推理

GPUStack 为在不同 GPU 上部署不同大模型选择理想的推理引擎，支持的头个推理引擎是 LLaMA.cpp，其他推理引擎（如vLLM）的支持也在路线图中。

在资源充足的情况下，GPUStack 默认将模型全部卸载到 GPU，以实现理想性能的推理加速。如果 GPU 资源相对不足，GPUStack 会同时使用 GPU 和 CPU 进行混合推理，以比较大限度地利用资源。而在没有 GPU 资源的场景下，GPUStack 也支持纯 CPU 推理。这样的设计使 GPUStack 能够更广泛地适配各种边缘或资源有限的环境。

快速与现有应用集成

GPUStack 提供了与 OpenAI 兼容的 API，并提供了大模型试验场。开发人员可以调试大模型并将其快速集成到自己的应用中。此外，开发人员还可以通过观测指标来了解应用对各种大模型的使用情况。这也有助于管理员有效地管理 GPU 资源利用。

GPU 和 LLM 的观测指标

GPUStack 提供全面的性能、利用率和状态监控指标。对于 GPU，管理员可以使用 GPUStack 实时监控资源利用率和系统状态。对于 LLM，相关指标则可以帮助开发人员评估模型的性能并优化应用。

认证和访问控制

GPUStack 为企业提供身份验证和RBAC（Role-based Access Control）功能。这保证了只有授权的管理员可以部署和管理大模型，只有授权的开发人员可以使用大模型，应用也可以通过统一的 API 认证授权访问各种大模型。

加入社区，参与开源共创

GPUStack 项目正在快速迭代，计划引入对多模态模型的支持，更多的 GPU 厂商支持，以及更多的推理引擎支持。我们十分欢迎您一起参与开源项目的贡献，也欢迎在我们的 GitHub 仓库 gpustack/gpustack 上点亮 Star 关注我们的比较新动态。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

GPUStack正式发布: 为大模型而生的开源GPU集群管理器

推荐关键词

24小时热搜

大家正在看

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源；ChatGPT搜索有被操纵风险

阿里云发布全栈AI负载高可用与用户共建AI时代云上IT新治理

三星与 Instacart 携手合作，通过标志性创新提升厨房体验

AI工具营销，现在是时候布局PC端了

Apple Intelligence占用空间暴涨，AI功能让存储和电池成负担

颠覆LLM格局，AI2新模型OLMo2，训练过程全公开，数据架构双升级

接连被开源项目curl、Prisma弃用，Rust语言遭遇水逆，网友：从狂热粉到后悔莫及

极光EngageLab携手StardustTV，助力短剧全球化发展

AI绘画辅助工具推荐：EzPrompt 让提示词编写不再困难

苹果AI功能冷遇：超过60%用户对Apple Intelligence不感兴趣

用AI引领学习，学而思学习机荣膺CES国际大奖

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

对标Siri和Alexa！OpenAI本周为ChatGPT推出测试版管理工具

特供版RTX 5090D被曝不能「炼丹」！AI算力3秒锁死，不支持多GPU配置

瓴羊Dataphin：AI驱动的数据治理——千里之行，始于标准

ChatGPT卷入爆炸案刷屏，AI安全正在成为最贵的学费

AI日报：对标Cursor！字节推AI编程工具Trae；MiniMax海螺语音全球上线；OpenAI将发布o3-mini

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUX Pro微调API可定制AI模型

CapCut随TikTok停止服务：Meta火速推新应用抢市场！

极光GPTBots与REDtone Digital Berhad强强联手共谱AI新篇章

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

GPUStack正式发布: 为大模型而生的开源GPU集群管理器

推荐关键词

24小时热搜

大家正在看

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源；ChatGPT搜索有被操纵风险

阿里云发布全栈AI负载高可用 与用户共建AI时代云上IT新治理

三星与 Instacart 携手合作，通过标志性创新提升厨房体验

AI工具营销，现在是时候布局PC端了

Apple Intelligence占用空间暴涨，AI功能让存储和电池成负担

颠覆LLM格局，AI2新模型OLMo2，训练过程全公开，数据架构双升级

接连被开源项目curl、Prisma弃用，Rust语言遭遇水逆，网友：从狂热粉到后悔莫及

极光EngageLab携手StardustTV，助力短剧全球化发展

AI绘画辅助工具推荐：EzPrompt 让提示词编写不再困难

苹果AI功能冷遇：超过60%用户对Apple Intelligence不感兴趣

用AI引领学习，学而思学习机荣膺CES国际大奖

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

对标Siri和Alexa！OpenAI本周为ChatGPT推出测试版管理工具

特供版RTX 5090D被曝不能「炼丹」！AI算力3秒锁死，不支持多GPU配置

瓴羊Dataphin：AI驱动的数据治理——千里之行，始于标准

ChatGPT卷入爆炸案刷屏，AI安全正在成为最贵的学费

AI日报：对标Cursor！字节推AI编程工具Trae；MiniMax海螺语音全球上线；OpenAI将发布o3-mini

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUX Pro微调API可定制AI模型

CapCut随TikTok停止服务：Meta火速推新应用抢市场！

极光GPTBots与REDtone Digital Berhad强强联手 共谱AI新篇章

阿里云发布全栈AI负载高可用与用户共建AI时代云上IT新治理

极光GPTBots与REDtone Digital Berhad强强联手共谱AI新篇章