“CAV-AHDV-CAV”框架:利用深度强化学习缓解交通振荡的新策略

CAV-AHDV-CAV: Mitigating Traffic Oscillations for CAVs through a Novel Car-Following Structure and Reinforcement Learning

摘要

本文由Xianda Chen等人撰写,针对混合交通环境中连接和自动化车辆(CAVs)与人类驾驶车辆(HDVs)共存时的交通振荡问题,提出了一种新颖的“CAV-AHDV-CAV”车辆跟随结构和强化学习方法。该研究通过将CAVs与HDVs之间的交互视为一个整体单元,利用深度强化学习分析车辆平衡状态,并采用状态融合策略,有效地减少了交通中的“停-走”模式。研究在多个数据集上进行了训练和测试,结果显示该模型在避免碰撞、维持车辆平衡以及降低时间头距标准差方面表现优异,显示出在混合交通环境中提高交通流效率和安全性的潜力。

原理

本文提出的“CAV-AHDV-CAV”车辆跟随框架通过将一系列HDVs视为一个聚合单元(AHDV),使跟随的CAV能够基于整体行为而非个体不可预测的动作来制定更稳健的控制策略。该框架利用车辆间通信(V2V)收集实时信息,预测交通振荡的传播,并通过调整跟随CAV的速度和保持稳定的时间头距来主动管理其行为。此外,该研究引入了车辆平衡状态和状态融合策略,通过融合来自前后CAV的信息,使跟随CAV能够动态调整其间隔和速度,确保相对于前后CAV的最优状态。

流程

研究首先在假设CAVs具备实时信息获取能力和V2V通信能力的基础上,建立了一个无限单车道段的混合交通车辆跟随场景。随后,通过定义车辆平衡状态和状态融合策略,跟随CAV能够根据前后CAV的信息调整其行为。实验部分使用了多个数据集,包括HighD、NGSIM、SPMD、Waymo和Lyft,共包含超过70,000个车辆跟随实例。在训练过程中,模型通过深度确定性策略梯度(DDPG)算法学习最优策略,最终在测试集上验证了其性能。

应用

该研究提出的方法不仅在理论上有助于理解和管理混合交通环境中的交通振荡问题,而且在实际应用中具有广泛的前景。通过优化CAVs的控制策略,可以显著减少交通拥堵和提高道路安全性,这对于未来的智能交通系统建设具有重要意义。此外,该方法还可以扩展到更复杂的交通场景,如多CAV协同控制,进一步提高交通系统的整体效率和可靠性。