返回

站长之家 - 业界 2023-11-02 14:13

用FP8训练大模型有多香？微软：比BF16快64%，省42%内存

低精度训练是大模型训练中扩展模型大小，节约训练成本的最关键技术之一。相比于当前的16位和32位浮点混合精度训练，使用 FP88位浮点混合精度训练能带来2倍的速度提升，节省50% -75% 的显存和50% -75% 的通信成本，而且英伟达最新一代卡皇 H100自带良好的 FP8硬件支持。但目前业界大

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

推荐关键词

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

微软LongRoPE方法让LLM上下文窗口突破 200 万 8倍扩展还保持性能

2024-04-291.0万阅读

微软与 OpenAI 计划建造拥有百万服务器的数据中心

2024-04-152.0万阅读

微软开源最强小参数大模型—Phi-3 Mini

2024-04-245645阅读

美国八家报纸起诉 OpenAI 和微软侵犯版权

2024-05-012.6万阅读

最低8GB 256GB售价9888元！微软Surface两款新品正式开售

2024-04-111.7万阅读

不联网！微软为美国情报机构部署基于GPT-4模型的AI

2024-05-092.2万阅读

微软迈入AI大模型竞赛，推出MAI-1挑战谷歌与OpenAI

2024-05-071.3万阅读

受ChatGPT等利好影响，微软、谷歌最新财报收入大增

2024-04-291.1万阅读

「代理人战争」！微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱

2024-05-061.1万阅读

发布几小时，微软秒删媲美GPT-4开源大模型！竟因忘记投毒测试

2024-04-242.3万阅读

欧盟监管机构批准微软对OpenAI的130亿美元投资

2024-04-182.4万阅读

微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列挑战OpenAI地位

2024-04-233455阅读

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把GPT-3.5淘汰了

2024-04-237043阅读

微软联合Quantinuum推最可靠逻辑量子比特量子计算可靠性提升800倍！

2024-04-112.6万阅读

淘宝88VIP无限次退货包运费服务正式上线

2024-04-222.8万阅读

淘宝88VIP会员权益重磅升级无限次退货包运费！

2024-04-222.5万阅读

首款极星手机Polestar Phone发布：7388元

2024-04-238303阅读

重启与OpenAI的谈判，苹果为iOS 18的AI找“备胎”

2024-05-031.6万阅读

7388元起售搭载骁龙8 Gen 3极星手机Polestar Phone正式发布

2024-04-237789阅读

谷歌向微软英特尔全面宣战：首款自研Arm CPU，最强大模型公测，AI视频对垒Sora

2024-04-101.7万阅读