中山大学等提出ScaleLong扩散模型 scaling操作可以稳定模型训练

要点:
1. UNet的long skip connection上的scaling操作可以稳定模型训练。
2. Scaling系数的设置影响模型性能，可以通过学习或固定的方式实现。
3. 对扩散模型任务在训练过程中特征和参数的可视化有助于理解模型稳定性。

站长之家（ChinaZ.com）3月1日消息:扩散模型中，UNet的long skip connection上的scaling操作被证实能够稳定模型训练。在一些流行的扩散模型中，如Imagen和Score-based generative model中，已经观察到设置scaling系数可以有效加速模型的训练过程。

但是，过去这种操作缺乏具体的分析，只是经验性地认为能够起到加速作用。现有研究发现，合理设置scaling系数可以缓解特征不稳定，进而提高模型对输入扰动的鲁棒性。

项目地址:https://github.com/sail-sg/ScaleLong

这项研究也揭示了scaling系数对梯度量级的控制以及对输入扰动的稳定性的影响。通过对扩散模型任务中特征和参数的可视化，研究人员发现了模型训练过程中的不稳定现象，这一发现促使他们在long skip connection上进行Scaling来进行统一地缓解。

通过引入可学习的模块，如Learnable Scaling （LS） Method，可以自适应地调整scaling系数，进一步稳定模型的训练。

此外，研究人员提出了一种无需额外参数的Constant Scaling （CS） Method，简化了模型实现过程。虽然LS在稳定训练上表现更好，但CS仍然是一种值得尝试的策略。这些方法的实现非常简洁，只需几行代码即可实现。最近的一些后续工作也进一步验证了skip connection上scaling的重要性，为这一领域的发展提供了新的思路和方向。

FouriScale官网体验入口高分辨率图像AI生成工具使用方法教程指南

2024-04-081.2万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

中山大学等提出ScaleLong扩散模型 scaling操作可以稳定模型训练

推荐关键词

24小时热搜

大家正在看

Melodisco官网体验入口 AI音乐发现和创作平台使用地址

谷歌推Scenic：可识别视频内容并生成详细描述

车内观影不晕车华为乾崑XSCENE光场屏发布：支持后装

FourieScale:无需训练，生成高分辨率图像

MOSY受邀亮相IFSCC国际化妆品科研大会，国际舞台见证中国创新

弹性供应链浪潮已来，RISC-V走向下一阶段

VQAScore官网体验入口 AI文本到视觉生成评估工具使用地址

商汤科技提出FouriScale 实现生成图像尺寸、分辨率自由

港大与浙大联合研发SC-GS模型鼠标拖拽实时可编辑3D重建

戴尔推出最新一代PowerScale，加速AI创新

School AI：为每个学生创建自己的聊天机器人

Ideogram更新！新增Describe功能增强文字渲染和照片写实效果

AI换装MagicClothing：专注实现可控的换装效果

FouriScale官网体验入口高分辨率图像AI生成工具使用方法教程指南

中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR

LLocalSearch官网体验入口局部搜索优化AI工具使用地址

Lixel CyberColor：自动生成无限大的电影级效果的3D场景

HTX亮相迪拜Blockchain Life 2024：推动加密应用广泛落地

戴尔存储解决方案Dell PowerScale：全球率先通过NVIDIA SuperPOD验证

科汇DECODE GLOBAL在美国获得新的金融牌照，加强国际货币服务能力

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

中山大学等提出ScaleLong扩散模型 scaling操作可以稳定模型训练

推荐关键词

24小时热搜

大家正在看

Melodisco官网体验入口 AI音乐发现和创作平台使用地址

谷歌推Scenic：可识别视频内容 并生成详细描述

车内观影不晕车 华为乾崑XSCENE光场屏发布：支持后装

FourieScale:无需训练，生成高分辨率图像

MOSY受邀亮相IFSCC国际化妆品科研大会，国际舞台见证中国创新

弹性供应链浪潮已来，RISC-V走向下一阶段

VQAScore官网体验入口 AI文本到视觉生成评估工具使用地址

商汤科技提出FouriScale 实现生成图像尺寸、分辨率自由

港大与浙大联合研发SC-GS模型 鼠标拖拽实时可编辑3D重建

戴尔推出最新一代PowerScale，加速AI创新

School AI：为每个学生创建自己的聊天机器人

Ideogram更新！新增Describe功能 增强文字渲染和照片写实效果

AI换装MagicClothing： 专注实现可控的换装效果

FouriScale官网体验入口 高分辨率图像AI生成工具使用方法教程指南

中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR

LLocalSearch官网体验入口 局部搜索优化AI工具使用地址

Lixel CyberColor：自动生成无限大的电影级效果的3D场景

HTX亮相迪拜Blockchain Life 2024：推动加密应用广泛落地

戴尔存储解决方案Dell PowerScale：全球率先通过NVIDIA SuperPOD验证

科汇DECODE GLOBAL在美国获得新的金融牌照，加强国际货币服务能力

谷歌推Scenic：可识别视频内容并生成详细描述

车内观影不晕车华为乾崑XSCENE光场屏发布：支持后装

港大与浙大联合研发SC-GS模型鼠标拖拽实时可编辑3D重建

Ideogram更新！新增Describe功能增强文字渲染和照片写实效果

AI换装MagicClothing：专注实现可控的换装效果

FouriScale官网体验入口高分辨率图像AI生成工具使用方法教程指南

LLocalSearch官网体验入口局部搜索优化AI工具使用地址