NVIDIA 悄悄开源了名为 Nemotron-70B 的 AI 模型,在基准测试中超越了众多知名模型,仅次于 OpenAI 的 o1。
Nemotron-70B 基于 Llama-3.1-70B 开发,能够在没有提示和额外推理的情况下解决复杂的问题。业内人士认为,NVIDIA 在 Llama 3.1 基础上训练出的这个模型是一次技术突破,超越了 GPT-4o 和 Claude 3.5 Sonnet。
目前,Llama-3.1-Nemotron-70B-Instruct 可在线体验。
此外,NVIDIA 还开源了 Nemotron 的训练数据集 HelpSteer2,包括:
- 21362 个提示响应,提升模型对人类偏好的理解,使其更加有用、真实和连贯。
- 20324 个提示响应用于训练,1038 个用于验证。