探索Rashomon效应:重塑机器学习的新视角

Amazing Things Come From Having Many Good Models

摘要

本文探讨了“Rashomon效应”,即对于同一数据集存在多个同样优秀的预测模型这一现象。文章提出,理解和利用Rashomon效应可以重塑我们对机器学习的思考方式,特别是在非确定性(噪声)环境下的表格数据问题。文章详细讨论了Rashomon效应如何影响简单而准确的模型存在性、用户偏好的灵活性、预测和解释的不确定性、变量重要性的稳定性、算法选择以及公共政策。此外,文章还讨论了Rashomon效应发生的理论和原因,并展示了其在社会复杂问题中使用机器学习的巨大影响。

原理

Rashomon效应的核心在于同一数据集可以支持多个性能相近的模型。这些模型在变量重要性、个体预测、复杂性、公平性等方面可能存在显著差异。文章通过定义“Rashomon集”,即与最佳模型性能相近的所有模型的集合,来量化这一效应。最近开发的算法能够捕获并存储非平凡函数类的Rashomon集,允许用户根据偏好(如公平性和单调性约束)与Rashomon集进行交互。这些算法还支持对变量重要性进行整体研究,包括所有优秀模型。

流程

文章通过具体示例展示了如何利用Rashomon集来解决机器学习中的关键问题。例如,使用TreeFARMS算法找到所有具有低正则化风险值的决策树,使用GAM Rashomon集算法找到准确的稀疏广义加性模型。这些算法不仅能够找到所有优秀的模型,还允许用户通过交互工具(如TimberTrek和GAMChanger)实时探索Rashomon集,以找到符合其领域知识的模型。此外,文章还展示了如何通过枚举给定函数类中的所有优秀模型来直接观察Rashomon效应。

应用

Rashomon效应的应用前景广泛,特别是在需要考虑解释性、公平性和稳定性的高风险决策中。文章指出,理解和利用Rashomon效应可以显著提高机器学习模型在社会复杂问题中的应用安全性、公平性和可靠性。此外,Rashomon效应的知识还可以用于指导政策制定,例如在刑事司法系统中默认使用可解释模型,以及在教育中推广关于Rashomon效应的伦理AI教育。