返回

站长之家 - 业界 2024-10-20 15:32

有望改写AI未来！NVIDIA全新nGPT使训练速度暴增20倍

快科技10月20日快讯：据报道，NVIDIA的研究取得突破，有望革新人工智能领域。其团队开发出一种新型神经网络架构——归一化Transformer（nGPT）。

nGPT架构在超球面上进行表示学习，大幅提升语言模型（LLM）的训练效率，最高可达20倍，且保持模型精度。

nGPT架构的核心是对所有向量，包括嵌入、多层感知机（MLP）、注意力矩阵和隐藏状态，进行归一化处理，使它们成为单位范数。

这种归一化处理使输入的词标记在超球面表面上移动，每一层模型通过位移对最终输出预测做出贡献。

实验结果表明，与标准Transformer模型相比，nGPT训练所需的步骤减少了4-20倍，具体加速效果取决于序列长度。

例如，在1k上下文下训练速度提升4倍，4k上下文提升10倍，8k上下文提升20倍。

研究人员表示，nGPT的优化路径始于超球面上的点，通过位移贡献最终输出预测，位移量由MLP和注意力模块定义。

这种方法不仅提升了训练速度，还增强了模型的稳定性。

相关话题

NVIDIA 归一化Transformer 大型语言模型 AI研究 nGPT架构介绍 AI未来发展趋势

推荐关键词

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

还能再涨23%！AI宠儿NVIDIA成大摩明年首选

2024-12-237861阅读

NVIDIA App被指致游戏帧率下降15%！关闭这个功能马上恢复

2024-12-171.3万阅读

NVIDIA、Intel、AMD三巨头罕见联手！共同投了AI芯片独角兽Ayar Labs

2024-12-122.3万阅读

RockAI国内首个「非Transformer架构大模型」Yan通过网信办备案

2024-12-041.2万阅读

NVIDIA 英伟达联合 Panduit 泛达发布人工智能结构化布线应用指南

2024-12-029195阅读

英伟达正式回应NVIDIA App导致游戏帧率暴降15%：官方解决办法来了

2024-12-181.6万阅读

一年吸金近300亿美元！NVIDIA成2024散户最爱

2024-12-261.1万阅读

阿丘科技荣获「2024 NVIDIA 创业企业展示——年度“荣耀企业”」称号!

2024-12-181.4万阅读

AI日报：ChatGPT AI搜索免费开放；谷歌AI视频模型Veo2优于Sora；Midjourney重磅上新个性化模型与情绪板

2024-12-171.9万阅读

AI日报：阶跃星辰内测视频大模型Step-Video；即梦AI图片2.1模型支持生成文字；腾讯发布混元视频生成大模型

2024-12-032.2万阅读

应对 AI 时代的云工作负载，开发者正加速向 Arm 架构迁移

2024-12-192.2万阅读

亚马逊推出第三代AI训练芯片Trainum3：3nm制程、性能翻倍

2024-12-047430阅读

AI日报：理想汽车AI大模型APP将上线；小米搭建GPU万卡集群投入AI；Deepseek V3开源；ChatGPT搜索有被操纵风险

2024-12-261.8万阅读

系列首款！华为nova 12 Ultra开启HarmonyOS NEXT公测

2024-12-071.5万阅读

AI日报：智谱AI发布AutoGLM升级版；Kimi灰测AI视频生成功能；SD3.5L新增三大ControlNet功能；ChatGPT诞生两周年

2024-11-292.2万阅读

史上最贵！首个AI Agent程序员商业化，比ChatGPT Pro贵2倍

2024-12-119039阅读

OpenAI正式推出AI视频生成模型Sora：ChatGPT订阅用户免费用

2024-12-102.4万阅读

AI日报：字节重磅推出豆包视觉理解模型；AI“魔改”宠物跳舞爆火；OpenAI开放满血o1模型API；即梦AI上线海报生成功能

2024-12-181.0万阅读

非遗贺春！AI与非遗交融，魔多蛇年春节AI模型创作大赛盛大启幕

2024-12-241.4万阅读

AI也会得老年痴呆！最新研究：AI版本越老越糊涂

2024-12-202.7万阅读