VADER:通过奖励梯度高效调整视频扩散模型的新方法
摘要
本文介绍了一种名为VADER的新方法,用于通过奖励梯度来调整预训练的视频扩散模型,以适应特定的下游任务。传统的调整方法需要收集目标视频数据集,这在实践中既困难又耗时。VADER利用预训练的奖励模型,这些模型基于强大的视觉判别模型学习了偏好,从而在生成RGB像素时提供密集的梯度信息,这对于在复杂搜索空间中进行高效学习至关重要。通过将这些奖励模型的梯度反向传播到视频扩散模型中,VADER能够在计算和样本效率上实现高效对齐。此外,VADER不仅限于文本到视频的生成,还能处理图像到视频的生成任务,展示了其广泛的适用性和高效性。
Read more...








