"实现公平分类:一种基于双玩家博弈的新方法"

Enhancing Class Fairness in Classification with A Two-Player Game Approach

摘要

本文针对分类任务中数据增强可能引入的不公平影响问题,提出了一种基于双玩家博弈的公平分类方法(FACT)。数据增强虽然能提升某些类别的性能,但可能对其他类别产生不利影响,这在某些应用领域中尤为关键。FACT方法通过将分类器的训练与数据增强问题形式化为一个公平优化问题,并进一步转化为一个对抗性双玩家博弈,从而确保类别间的公平性。文章还提出了一种新的乘法权重优化算法,并从理论上证明了该算法能够收敛到一个对所有类别公平的解决方案。实验结果表明,该方法在五个数据集上的分类器性能分布更为公平,且对平均准确率的影响有限。

原理

FACT方法的核心在于将公平分类问题形式化为一个双玩家博弈,其中“最大玩家”旨在最大化模型的整体准确率,而“最小玩家”则专注于确保不同类别间的公平性。通过这种博弈形式,文章提出了一种乘法权重更新算法,该算法动态调整每个类别的权重,使得性能较弱的类别得到更多关注。这种方法通过引入一种机制,鼓励“最小玩家”考虑“最大玩家”的目标,从而在准确率和公平性之间达成平衡。理论分析表明,该算法能够保证混合策略的平均损失接近任何固定策略可达到的最小损失。

流程

FACT方法的工作流程包括初始化模型参数和权重向量,然后在每个训练周期中,模型参数根据计算的损失进行更新。权重向量则根据模型在所有类别上的性能进行调整,使用乘法权重算法基于每个类别的准确率来更新权重。这一过程重复进行,直到达到预设的训练周期数,最终得到既准确又公平的分类器。具体流程如算法1所示,详细描述了模型参数和权重向量的初始化、更新以及训练过程的迭代。

应用

FACT方法的应用前景广泛,特别是在需要公平分类的领域,如医疗诊断、金融风险评估和法律判决支持系统等。该方法能够确保不同群体或类别在分类决策中得到公平对待,减少偏见和歧视,从而提高机器学习模型在社会决策支持系统中的可信度和接受度。