探索NeuFair:通过神经元丢弃技术提升深度神经网络的公平性

NeuFair: Neural Network Fairness Repair with Dropout

摘要

本文探讨了深度神经网络(DNNs)在社会关键领域应用中的公平性问题,特别是在决策过程中可能存在的偏见和歧视。论文提出了一种名为NeuFair的新方法,通过在推理阶段随机丢弃神经元来改善预训练DNNs的公平性。这种方法利用随机化算法,特别是模拟退火(SA)和随机游走(RW),来寻找最优的神经元丢弃集,以最小化歧视同时保持模型的效用。实验结果显示,NeuFair能够有效提高模型公平性(最高达69%的改进),且对模型性能的影响最小。

原理

NeuFair的核心思想是在预训练的DNNs中,通过在推理阶段随机丢弃神经元来减少模型中的偏见。这种方法不同于传统的在训练过程中使用丢弃技术来防止过拟合,而是在模型已经训练完成后,通过选择性地丢弃神经元来调整模型的输出,从而减少对特定群体的偏见。NeuFair使用随机化算法来探索可能的神经元丢弃组合,目标是找到一个既能减少歧视指标(如Equalized Odds Difference, EOD)又能保持模型性能(如F1分数)的平衡点。

流程

NeuFair的工作流程包括以下几个步骤:

  1. 初始化:选择一个初始的神经元丢弃状态。
  2. 成本计算:计算当前丢弃状态下的模型公平性和性能。
  3. 状态更新:使用模拟退火或随机游走算法生成新的丢弃状态,并根据成本函数决定是否接受新状态。
  4. 迭代优化:重复上述过程,直到找到满足预设公平性和性能标准的最优丢弃状态。
  5. 模型修复:应用找到的最优丢弃状态,生成修复后的模型。

应用

NeuFair的应用前景广泛,特别是在需要高度公平性的领域,如司法判决、金融服务、医疗决策等。通过提高模型的公平性,NeuFair有助于减少算法决策中的歧视问题,增强公众对AI系统的信任。此外,该方法的可解释性和灵活性也使其成为研究和实际应用中的有力工具。