Edge-DIRECT:革新电动车辆路径优化的新方法

Edge-DIRECT: A Deep Reinforcement Learning-based Method for Solving Heterogeneous Electric Vehicle Routing Problem with Time Window Constraints

摘要

本文针对发达国家的碳中和政策背景下,物流公司面临的电动车辆路径优化问题,特别是异构电动车辆路径问题(HEVRPTW)进行了研究。HEVRPTW考虑了车辆的不同属性和客户对配送时间窗口的需求,是一个NP难优化问题。本文提出了一种基于深度强化学习(DRL)的方法——Edge-DIRECT,该方法通过增强的图表示和双注意力机制来解决这一问题,显著提高了路径规划的质量和执行效率。实验结果表明,Edge-DIRECT在解决HEVRPTW问题上优于现有的DRL方法和启发式方法。

原理

Edge-DIRECT的核心在于其Transformer风格的策略网络,该网络包含一个边缘增强的双注意力编码器和一个特征增强的双解码器。编码器通过图注意力层捕捉节点间的可达性关系,并利用能量消耗和旅行时间信息增强节点特征。解码器则通过双注意力机制处理车辆的异构性,确保在决策过程中考虑车辆的电池和载货能力。这种设计使得模型能够有效地处理时间窗口约束和车辆异构性,从而生成更优的路径解决方案。

流程

Edge-DIRECT的工作流程从构建时间窗口图开始,图中节点代表客户和充电站,边表示节点间的可达性。编码器通过图注意力层处理这些信息,生成节点的高维特征表示。解码器在每个步骤中选择一个车辆和一个节点进行访问,基于车辆的当前状态和节点的特征进行决策。整个过程通过深度强化学习算法进行训练,利用REINFORCE方法优化策略网络的参数,以最小化总旅行时间。

应用

Edge-DIRECT的应用前景广阔,特别适用于需要高效管理电动车辆路径的物流公司。随着电动车辆的普及和碳中和政策的推进,该方法能够帮助企业优化配送路线,减少能源消耗和运营成本,同时满足客户对配送时间窗口的需求。此外,该方法还可以扩展到其他涉及时间窗口和异构资源的优化问题中。