MPR:打破偏见,实现公平检索的新指标
摘要
本文主要介绍了一种名为多组比例表示(MPR)的新型检索指标,用于衡量检索任务中交叉群体的表示情况。文章讨论了 MPR 的工作原理、计算方法以及在图像检索中的应用。通过实验,作者证明了 MPR 在平衡检索相似度和公平性方面的有效性,并展示了其在促进交叉群体的比例表示方面的优势。
原理
MPR 的工作原理是通过计算一组表示统计量的最坏情况偏差来衡量交叉群体的表示情况。具体来说,MPR 定义为在检索到的项目集合中,每个表示统计量的平均值与参考群体中相应统计量的期望值之间的最大偏差。通过这种方式,MPR 可以捕捉到复杂的交叉群体表示,并且可以通过优化算法来确保在检索中满足 MPR 约束。
流程
MPR 的工作流程包括以下几个步骤:
- 定义参考表示分布 Q 和表示统计量类 C。
 - 计算 MPR 指标,即 MPR(C, R, Q)。
 - 使用优化算法,如 MAPR,来检索满足 MPR 约束的项目集合 R。
 - 在检索过程中,通过调用 MPR 违规检测的 oracle 来不断调整检索策略,以确保 MPR 约束得到满足。
 
应用
MPR 可以应用于各种检索任务,如图像检索、文本检索等。通过确保交叉群体的比例表示,MPR 可以帮助减少检索结果中的偏差和不公平性,提高检索系统的公正性和可靠性。此外,MPR 还可以用于评估和比较不同检索算法的性能,为检索系统的设计和优化提供指导。
