牛津大学研究:多目标组合优化框架在合成人口生成中的应用
摘要
本文由Imran Mahmood等人撰写,提出了一种用于大规模分层人口合成的多目标组合优化框架。在基于代理的模拟中,合成人口常用于表示个体的结构、行为和交互。然而,生成一个准确反映真实人口统计数据的合成人口是一项挑战,尤其是在大规模操作时。本文介绍了一种多目标组合优化技术,用于大规模人口合成,并通过生成选定区域的合成人口并在真实人口数据的列联表上进行验证,展示了其有效性。该方法支持个体和家庭之间的复杂层次结构,可扩展到大规模人口,并实现了最小的列联表重建误差。因此,它为政策制定者和研究人员提供了一个有用的工具,用于模拟复杂人口的动态。
原理
本文提出的方法将合成人口生成问题形式化为一个多目标优化问题,使用非支配排序遗传算法II(NSGA-II)来生成和优化合成人口。NSGA-II结合了遗传算法和非支配排序,有效地在组合空间中搜索最优解。优化目标包括个体的统计和空间分布,并允许根据模拟上下文对这些目标进行加权。该方法的关键贡献包括:
- 开发了一种新颖的方法,使用多目标组合优化技术生成准确代表统计结构的国家规模合成人口。
 - 评估了生成人口的代表性和准确性,方法的可扩展性以及生成过程的计算效率。
 - 通过在牛津市选定区域的合成人口生成案例研究,展示了所提出方法的实际实施。
 
流程
本文的工作流程包括以下步骤:
- 定义数据结构和个体(解决方案)的编码,以及存储一组个体的总体。
 - 生成随机样本的个体和家庭,并使用人口普查数据约束将个体分配到家庭中。
 - 使用遗传算法(GA)进行多目标组合优化,包括选择、交叉和变异操作。
 - 使用NSGA-II算法进行迭代优化,通过快速非支配排序和拥挤距离度量来维持种群多样性。
 - 通过案例研究验证方法的有效性,生成代表性的合成人口,并评估其准确性和计算效率。
 
应用
本文提出的方法适用于城市规划、交通和公共卫生建模等领域,为政策制定者和研究人员提供了一个强大的工具,用于模拟复杂人口的动态。该方法的可扩展性和适应性使其能够应用于不同的地理区域和数据类型,为未来的研究和实践提供了广阔的应用前景。
