探索文本到图像生成中的事实性与多样性平衡:DoFaiR基准与FAI方法
摘要
本文探讨了在文本到图像(T2I)生成模型中使用多样性干预措施时,如何保持历史人物的种族和性别分布的真实性。文章提出了DemOgraphic FActualIty Representation(DoFaiR)基准,用于评估多样性干预与保持历史真实性之间的权衡。研究发现,尽管多样性干预增加了图像中不同性别和种族群体的数量,但同时也导致了历史人口分布的不准确。为了解决这一问题,文章提出了Fact-Augmented Intervention(FAI)方法,该方法通过引导大型语言模型(LLM)反思和整合历史事实信息,从而在保持多样性的同时提高生成图像的真实性。
Read more...








