"创新噪声调度提升扩散模型训练效率:ImageNet基准测试的新突破"

Improved Noise Schedule for Diffusion Training

摘要

本文介绍了一种改进扩散模型训练中噪声调度的新方法。扩散模型在生成视觉信号方面已成为事实上的选择,但其训练过程中预测不同噪声水平存在挑战,需要大量迭代和计算成本。本文提出的关键见解是通过对信号噪声比(SNR)的对数进行重要性采样,等效于修改噪声调度,特别有利于在SNR对数接近零时提高采样频率,从而提高训练效率。实验证明,这种方法在ImageNet基准测试中优于标准余弦调度,并显示出对不同预测目标的持续益处。

原理

本文提出的噪声调度设计通过重要性采样方法,优化了扩散模型训练过程中的噪声分配。具体来说,通过调整噪声强度λ的采样概率p(λ),使得在λ接近零(即SNR对数接近零)时分配更多的计算资源,从而提高训练效率。这种方法通过实验验证,特别是在Laplace噪声调度下,能够显著提升模型性能。

流程

在训练过程中,首先从均匀分布中采样时间步t,然后根据定义的噪声调度函数计算相应的噪声强度λ。通过调整p(λ)的分布,使得在λ接近零时采样概率更高。在实际应用中,使用DDIM采样方法,结合新的噪声调度进行图像生成。例如,在ImageNet数据集上,使用500K迭代次数的训练预算,通过FID指标评估,显示出噪声调度在256×256和512×512分辨率下的优越性能。

应用

本文提出的噪声调度方法不仅适用于图像合成和视频生成等视觉信号生成领域,还可能扩展到其他需要高效训练扩散模型的场景,如高分辨率图像合成和复杂数据分布的近似。随着进一步的研究和优化,这种方法有望在大规模应用中发挥重要作用。