探索高得分区域:基于扩散模型的离线模型基础优化新方法
摘要
本文介绍了一种新颖的条件生成建模方法,用于解决离线模型基础优化(MBO)问题,通过学习从数据集中构建的合成轨迹来改进解决方案。该方法首先构建朝向高得分区域的合成轨迹,并注入局部偏差以保持改进方向的一致性。随后,训练一个条件扩散模型,生成基于得分的轨迹。最后,通过引导采样从训练模型中采样多个轨迹,探索数据集外的高得分区域,并使用代理函数在生成的轨迹中选择高保真设计。实验结果表明,该方法在Design-Bench及其变体上优于竞争基线。
Read more...








