昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE

站长之家(ChinaZ.com) 6月3日消息:2024年6月3日，昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型，名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的，是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。同时，这也是全球首个支持在单台4090服务器上进行推理的开源千亿级 MoE 大模型。

Skywork-MoE 的模型权重、技术报告完全开源，可以免费商用，无需申请。模型的总参数量为146B，激活参数量为22B，共有16个 Expert，每次激活其中的2个 Expert。与其他主流模型相比，在相同的激活参数量下，Skywork-MoE 的性能接近70B 的 Dense 模型，推理成本下降了近3倍。

微信截图_20240603174240.png

为了解决 MoE 模型训练困难、泛化性能差等问题，Skywork-MoE 采用了两种训练优化算法:Gating Logits 归一化操作和自适应的 Aux Loss。此外，为了高效进行大规模分布式训练，Skywork-MoE 提出了两个并行优化设计:Expert Data Parallel 和非均匀切分流水并行。

在推理方面，Skywork-MoE 是目前能够在8台4090服务器上进行推理的最大开源 MoE 模型。通过首创的非均匀 Tensor Parallel 并行推理方式，在 FP8量化下，Skywork-MoE 可以实现2200tokens/s 的吞吐。

•模型权重下载:

￮https://huggingface.co/Skywork/Skywork-MoE-base

￮https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

•模型开源仓库:https://github.com/SkyworkAI/Skywork-MoE

•模型技术报告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

•模型推理代码:（支持8x4090服务器上8bit 量化加载推理） https://github.com/SkyworkAI/vllm

技术奇迹！清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

2025-02-151.5万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE

推荐关键词

24小时热搜

大家正在看

字节跳动豆包团队开源MoE架构优化技术：可将大模型训练效率提升1.7倍

技术奇迹！清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

DeepSeek第二炸：开源首个用于 MoE 模型训练通信库

苹果也在蒸馏大模型，给出了蒸馏Scaling Laws

百度有史以来最强大模型！李彦宏：文心大模型4.5系列将开源

李彦宏回应文心大模型4.5开源：DeepSeek让我们明白要将最优秀模型开源

全球首测！OpenAI开源SWELancer，大模型冲击100万年薪

《旅行青蛙》宣布终止运营 VIVO服务器将于4月19日关闭

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

L40S显卡助力Deepseek大模型训练与推理：超强性能，精确高效

当平价轻薄本也能跑本地大模型，AI PC才有了未来

追求最佳TCO，忆联PCIe 5.0 SSD为大模型加速

DeepSeek超越150万模型：成全球最受欢迎开源大模型

国外权威认证！DeepSeek超150万模型，成最受欢迎开源大模型

反超DeepSeek！阿里万相大模型登上全球开源榜首

超擎擎天系列AI训推一体服务器、锋锐系列AI推理服务器：DeepSeek私有化部署的极简方案

AI日报：可生成汉字！智谱开源文生图模型CogView4；大模型工具Ollama存在严重漏洞；腾讯元宝下载量超DeepSeek

AI日报：DeepSeek开源大模型加速器FlashMLA；海螺AI推I2V-01-Director模型；Pixverse V4.0支持同步音效与转绘功能

亚马逊SHOPLINE联手，独立站商家共享Prime服务

DeepSeek满血版上线：让“服务器繁忙”成为过去式！