探索未来城市:MetaUrban——具身AI在都市空间的新前沿
摘要
本文介绍了一种名为MetaUrban的新型模拟平台,该平台专为城市空间中的具身人工智能(Embodied AI)研究设计。随着机器人和具身AI技术的进步,公共城市空间不再仅限于人类使用,食品配送机器人、电动轮椅和各种机器人狗等设备已经开始共享这些空间。MetaUrban平台通过组合元素构建了无数交互式城市场景,涵盖了广泛的地图布局、物体摆放、行人和其他移动代理的外观和动态。该平台设计了点导航和社交导航任务,通过强化学习和模仿学习建立了多种基准。实验表明,模拟环境的组合性质可以显著提高训练移动代理的泛化性和安全性。MetaUrban将公开提供,以促进城市空间中安全可信的具身AI研究。
原理
MetaUrban通过层次布局生成、可扩展对象检索和共居者填充三个关键设计,支持展示城市空间的独特特征——多样布局、特定对象分布和复杂动态。层次布局生成采用过程生成方法,从街道块到人行道、功能区域和对象位置,生成无限布局。可扩展对象检索通过从全球城市场景数据中获取真实世界的对象分布,构建大规模高质量静态对象集。共居者填充利用数字人类的进步,丰富行人和弱势道路用户的外观、动作和轨迹,并整合其他代理,形成生动的共居环境。这些设计共同支持了MetaUrban生成无限训练和评估环境的能力,从而提高了具身AI代理的泛化性和安全性。
流程
MetaUrban的工作流程从街道块地图开始,规划地面布局,分割不同功能区域,然后放置静态对象,最后填充动态代理。例如,一个食品配送机器人在MetaUrban中需要跨越多个街道块,导航充满障碍物的街道,并妥善处理行人和人群,以避免碰撞。通过这种流程,MetaUrban能够自动生成复杂的都市场景,为具身AI研究提供丰富的训练和测试环境。
应用
MetaUrban的应用前景广泛,包括机器人导航、社交机器人、交互系统、城市规划和基础设施发展等领域。通过提供模拟工具和洞察城市空间的利用方式,MetaUrban可以促进经济和社会效率的提升。此外,MetaUrban还支持辅助技术的开发,有助于提高公共服务的可达性和城市空间的宜居性。随着技术的进一步发展,MetaUrban有望在更多领域发挥重要作用,推动具身AI技术的广泛应用。
