站长之家 - 业界 2023-11-28 09:55

UltraFastBERT：推理过程仅用0.3%神经元，性能与类似的BERT模型相当

**划重点:**
1. 🧠 **创新介绍:** ETH Zurich研究人员成功开发了UltraFastBERT，通过使用快速前馈网络（FFFs）在推理过程中仅使用0.3%的神经元，实现了与其他模型相当的性能水平。
2. 🚄 **性能提升:** 通过简化的FFFs替代传统模型的前馈网络，UltraFastBERT在保持高效语言建模的同时，取得了显著的速度提升，甚至达到48倍到78倍的CPU上的推理速度提升。
3. 🛠 **潜在应用:** 该研究不仅提供了高水平的CPU和PyTorch实现，还建议通过混合稀疏张量和设备特定优化，以及通过多个FFF树的联合计算，进一步加速大型语言模型，如GPT-3。

站长之家（ChinaZ.com）11月28日消息:近日，ETH Zurich的研究人员成功推出了一项创新性的技术——UltraFastBERT，该技术通过在推理过程中仅使用0.3%的神经元，实现了与其他类似BERT模型相当的性能水平。这一创新主要通过引入快速前馈网络（FFFs）来解决在推理过程中减少神经元数量的问题，相较于基准实现，取得了显著的速度提升。

研究人员提供了代码、基准设置以及模型权重，支持了这一方法的有效性。他们建议进一步探索通过混合稀疏张量和设备特定优化，以及在大型语言模型中应用多个FFF树的潜在性能提升。

UltraFastBERT在推理过程中展现了高效的语言建模，通过将传统模型的前馈网络替换为简化的FFFs，使用一致的激活函数和所有节点输出权重，同时消除了偏差。多个FFF树协同计算中间层输出，允许多样化的架构。所提供的高水平CPU和PyTorch实现显著提升了速度，而研究还探讨了通过多个FFF树和替换大型语言模型前馈网络为FFFs，实现潜在加速的可能性。为设备特定优化，建议使用Intel MKL和NVIDIA cuBLAS。

UltraFastBERT不仅在推理中仅使用0.3%的神经元的情况下实现了与BERT-base相当的性能，而且在仅使用单个GPU进行一天训练的情况下，仍保持至少96.0%的GLUE预测性能。研究还展示了通过快速前馈层实现显著的速度提升，达到48倍到78倍的CPU上的即时推理速度提升，以及GPU上的3.15倍速度提升，表明在替换大型模型方面存在潜在可能性。

总体而言，UltraFastBERT是对BERT的修改，实现了在推理过程中仅使用少量神经元的高效语言建模。该模型通过FFFs实现了显著的速度提升，提供的CPU和PyTorch实现分别实现了78倍和40倍的速度提升。研究建议通过实现有条件神经执行的基元，进一步加速语言建模。尽管仅使用0.3%的神经元，UltraFastBERT的最佳模型与BERT-base的性能相当，展示了高效语言建模的潜力。UltraFastBERT展示了高效语言建模的潜在进展，为未来更快、资源友好的模型铺平了道路。

未来研究的建议包括使用混合向量级稀疏张量和设备特定优化实现高效的FFF推理，探索有条件神经执行加速语言建模的全部潜力，以及通过将前馈网络替换为FFFs优化大型语言模型的潜在性。未来的工作可能着重于在流行框架如PyTorch或TensorFlow中实现可重现的模型，并进行广泛的基准测试，以评估UltraFastBERT及类似高效语言模型的性能和实际影响。

论文地址:https://arxiv.org/abs/2311.10770

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

UltraFastBERT：推理过程仅用0.3%神经元，性能与类似的BERT模型相当

推荐关键词

24小时热搜

大家正在看

小米回应SU7演示手车互联交互时出现卡顿：并非Bug

雷军宣布挑战买一辆理想L6 理想：欢迎雷总加入大家庭

24.98万元起！问界新M5单日大定1250台：标配华为智驾系统

理想汽车降价高管首度回应

OPPO Find X7 Ultra 512GB卫通版明天首销：6799元

当前最强国产Sora！清华团队突破16秒长视频，懂多镜头语言，会模拟物理规律

vivo X100 Ultra影像绝了：一张照片50M 放大几十倍依然清晰

步步高超市降3000 商品售价：践行胖东来理念

反诈拨正充值乱象，《蛋仔派对》守护未成年财产安全

打造高品质“文旅生态圈”！itc保伦股份智慧文旅音视频整体解决方案重磅上线！

联发科英伟达合力推新品，高通慌了

江洲网怎么样，立足社会需求，打造品质服务

天工展翅跃见非凡丨新迪数字2024新品发布会圆满召开！

喜报极光获颁“深圳市跨国公司总部企业”称号

极光推送鸿蒙版SDK正式上线，全面适配HarmonyOS NEXT华为原生鸿蒙系统

“酒行药势”，参龟固本酒，专注古法养生新赛道

东阳向东龙耀新生｜东阳湖畔云邸宝龙天地推介会暨招商大会繁华启程！

职业教育在新时代的使命与担当——培育新质生产力

广州遇强对流天气：冰雹龙卷风齐上阵

vivo X100 Ultra影像无敌：一张照片50M 放大几十倍依然清晰

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

UltraFastBERT：推理过程仅用0.3%神经元，性能与类似的BERT模型相当

推荐关键词

24小时热搜

大家正在看

小米回应SU7演示手车互联交互时出现卡顿：并非Bug

雷军宣布挑战买一辆理想L6 理想：欢迎雷总加入大家庭

24.98万元起！问界新M5单日大定1250台：标配华为智驾系统

理想汽车降价 高管首度回应

OPPO Find X7 Ultra 512GB卫通版明天首销：6799元

当前最强国产Sora！清华团队突破16秒长视频，懂多镜头语言，会模拟物理规律

vivo X100 Ultra影像绝了：一张照片50M 放大几十倍依然清晰

步步高超市降3000 商品售价：践行胖东来理念

反诈拨正充值乱象，《蛋仔派对》守护未成年财产安全

打造高品质“文旅生态圈”！itc保伦股份智慧文旅音视频整体解决方案重磅上线！

联发科英伟达合力推新品，高通慌了

江洲网怎么样，立足社会需求，打造品质服务

天工展翅 跃见非凡丨新迪数字2024新品发布会圆满召开！

喜报 极光获颁“深圳市跨国公司总部企业”称号

极光推送鸿蒙版SDK正式上线，全面适配HarmonyOS NEXT华为原生鸿蒙系统

“酒行药势”，参龟固本酒，专注古法养生新赛道

东阳向东 龙耀新生｜东阳湖畔云邸宝龙天地推介会暨招商大会繁华启程！

职业教育在新时代的使命与担当——培育新质生产力

广州遇强对流天气：冰雹龙卷风齐上阵

vivo X100 Ultra影像无敌：一张照片50M 放大几十倍依然清晰

理想汽车降价高管首度回应

天工展翅跃见非凡丨新迪数字2024新品发布会圆满召开！

喜报极光获颁“深圳市跨国公司总部企业”称号

东阳向东龙耀新生｜东阳湖畔云邸宝龙天地推介会暨招商大会繁华启程！