AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

**划重点:**
1. 🚀 AI2发布了开放语言模型（OLMo），该框架旨在促进大规模语言模型的研究和实验，通过在Hugging Face和GitHub上提供训练代码、模型和评估代码来实现。
2. 🛠 OLMo的首批模型包括7B规模的四个变体和1B规模的一个模型，涵盖不同的架构、优化器和训练硬件，旨在满足多样化的研究需求。
3. 🌍 该项目的目标是建立全球最好的开放语言模型，已经启动不同规模、模态、数据集、安全措施和评估等方面的工作。

站长之家（ChinaZ.com）2月2日消息:AI2最新发布的开放语言模型（OLMo）框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码，AI2致力于让学术界和研究人员能够共同研究语言模型的科学，探索新的预训练数据子集对下游性能的影响，以及研究新的预训练方法和稳定性。

该项目的首批模型包括四个7B规模的最终变体，对应不同的架构、优化器和训练硬件，以及一个1B规模的模型，所有模型均在至少2T令牌上进行了训练。这是一个长期计划的第一步，计划继续发布更大规模的模型、经过指导调整的模型以及更多变体。

每个模型都提供完整的训练数据，包括生成训练数据的代码，以及用于分析预训练数据的AI2的Dolma和WIMBD。此外，还提供了完整的模型权重、训练代码、训练日志、以Weights & Biases日志形式呈现的训练指标，以及推理代码。每个模型的训练过程中的500多个检查点也可在HuggingFace上作为修订版本获得。

在创建强大的开放模型时，AI2从许多其他开放和部分开放的模型中吸取了经验，并将它们作为OLMo的竞争基准。该项目的技术报告提到，OLMo7B模型在诸如生成任务或阅读理解（如truthfulQA）等方面超过了Llama2，但在流行的问答任务(如MMLU或Big-bench Hard)上略显落后。

对于1B OLMo模型，使用AI2的Paloma和可在GitHub上获得的检查点进行了分析，以探讨模型在语言预测和模型规模等因素之间的关系。AI2强调Paloma的方法试图通过均匀采样各个领域，更平衡地表示使用语言模型的众多领域。

OLMo框架采用了最新文献中的许多趋势，包括不使用偏见（如PaLM中的稳定性）、PaLM和Llama使用的SwiGLU激活函数、Rotary位置嵌入(RoPE)以及GPT-NeoX-20B的BPE基础标记器的修改版本，旨在减少个人可识别信息。

该发布仅是OLMo和框架的开端，未来计划推出不同规模、模态、数据集、安全措施和评估等方面的工作。AI2鼓励使用OLMo模型，提供了简便的安装步骤和使用示例，并表示未来将推出指导调整的模型、完整的训练日志和wandb报告等功能。

博客网址:https://blog.allenai.org/olmo-open-language-model-87ccfc95f58

项目入口：https://top.aibase.com/tool/olmo

英伟达Blackwell 芯片因过热问题延迟出货，或影响科技巨头客户部署

2024-11-187979阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

推荐关键词

24小时热搜

大家正在看

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

Sam Altman：明年OpenAI将迈入AI系统时代

三星Galaxy Z Fold6：AI折叠大屏生产力的高效体验

Jellycat风靡，AI宠物崛起，人类用什么抵御孤独？

曝AMD将进军手机领域！推出“Ryzen AI”移动SoC

年末换机好选择三星Galaxy S24系列用AI为冬季生活加点料

让AI激发创作！首届豆包MarsCode AI编程挑战赛报名开启

英伟达Blackwell 芯片因过热问题延迟出货，或影响科技巨头客户部署

致命错误！Sam Altman发一张对比图，遭到大量吐槽

AMD苏姿丰预言AI芯片每年60%爆发增长！2028年将达5000亿美元规模

AI日报：OpenAI重磅上线Sora；智谱AI免费多模态模型GLM-4V-Flash；腾讯云打造AI代码助手

苹果与华为手机AI大战正式打响：史上最强Mate AI功能全面升级

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

三星Galaxy Z Flip6:用“AI”留下冬日的种种美好

惊喜！OpenAI第3天产品会很炸裂，Sam Altman非常兴奋

AI日报：抖音“V项目”上线AI分身功能；微信公众号推AI音色克隆功能；Kimi数学推理模型k0-math；AI自习室悄悄兴起

高通独占期结束！微软Win11回顾等AI功能扩展到Intel/AMD设备

AI影像实力说话三星Galaxy Z Flip6轻松创作冬日视觉大片

AMD锐龙AI 7 PRO 360U现身中国！联想专属只有15W TDP

AI让妙笔生花三星Galaxy Tab S10系列年末热销中

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

推荐关键词

24小时热搜

大家正在看

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

Sam Altman：明年OpenAI将迈入AI系统时代

三星Galaxy Z Fold6：AI折叠大屏生产力的高效体验

Jellycat风靡，AI宠物崛起，人类用什么抵御孤独？

曝AMD将进军手机领域！推出“Ryzen AI”移动SoC

年末换机好选择 三星Galaxy S24系列用AI为冬季生活加点料

让AI激发创作！首届豆包MarsCode AI编程挑战赛报名开启

英伟达Blackwell 芯片因过热问题延迟出货，或影响科技巨头客户部署

致命错误！Sam Altman发一张对比图，遭到大量吐槽

AMD苏姿丰预言AI芯片每年60%爆发增长！2028年将达5000亿美元规模

AI日报：OpenAI重磅上线Sora；智谱AI免费多模态模型GLM-4V-Flash；腾讯云打造AI代码助手

苹果与华为手机AI大战正式打响：史上最强Mate AI功能全面升级

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

三星Galaxy Z Flip6:用“AI”留下冬日的种种美好

惊喜！OpenAI第3天产品会很炸裂，Sam Altman非常兴奋

AI日报：抖音“V项目”上线AI分身功能；​微信公众号推AI音色克隆功能；Kimi数学推理模型k0-math；AI自习室悄悄兴起

高通独占期结束！微软Win11回顾等AI功能扩展到Intel/AMD设备

AI影像实力说话 三星Galaxy Z Flip6轻松创作冬日视觉大片

AMD锐龙AI 7 PRO 360U现身中国！联想专属 只有15W TDP

AI让妙笔生花 三星Galaxy Tab S10系列年末热销中

年末换机好选择三星Galaxy S24系列用AI为冬季生活加点料

AI日报：抖音“V项目”上线AI分身功能；微信公众号推AI音色克隆功能；Kimi数学推理模型k0-math；AI自习室悄悄兴起

AI影像实力说话三星Galaxy Z Flip6轻松创作冬日视觉大片

AMD锐龙AI 7 PRO 360U现身中国！联想专属只有15W TDP

AI让妙笔生花三星Galaxy Tab S10系列年末热销中