主动学习在基于导数的全局敏感性分析中的应用
摘要
本文探讨了针对昂贵的黑盒函数进行全局敏感性分析的主动学习问题。目标是通过高效的实验资源分配,学习不同输入变量(如车辆安全实验中的组件厚度)对安全目标的影响。由于函数评估成本高昂,本文提出了直接针对基于导数的全局敏感性度量(DGSMs)的主动学习获取函数,这些函数基于高斯过程代理模型。通过在合成和现实世界问题上的全面评估,本文展示了这些主动学习策略如何显著提高DGSM估计的样本效率,特别是在评估预算有限的情况下。本文的工作为科学和工程应用中的更高效和准确的敏感性分析铺平了道路。
原理
本文提出的主动学习方法直接针对DGSMs的关键量,如梯度、梯度的绝对值和梯度的平方。这些方法基于不确定性减少和信息增益的获取函数,并展示了如何在高斯过程模型下进行信息增益的可行计算。通过在合成和现实世界问题上的彻底评估,本文展示了主动学习如何显著加速在有限评估预算下的全局敏感性分析(GSA)。
流程
主动学习过程包括三个主要步骤:首先,在每次迭代中,基于已评估的数据点构建高斯过程(GP)代理模型。其次,使用获取函数对未评估的输入进行评分,该函数通常指导输入空间探索同时尝试学习目标量。最后,在选定的输入上评估黑盒函数,并将新观察结果添加到数据集中。本文还通过Forrester测试函数的示例展示了这些获取函数的工作流程,说明了为什么仅针对学习f的主动学习策略对于学习DGSMs在预算上不是有效的。
应用
本文提出的主动学习方法在科学和工程领域具有广泛的应用前景,特别是在那些函数评估涉及耗时模拟或昂贵实验室实验的领域。例如,在环境建模中,特别是在气候变化研究中,敏感性分析有助于理解各种参数(如CO2排放、温度升高或森林砍伐率)如何影响气候模型的输出。通过识别哪些变量最直接影响模型结果,研究人员可以更好地优先考虑数据收集、模型改进和政策制定的工作。
