昌锡铭, 康子繁, 冯紫嫣, 孙会君
共享出行服务的快速发展为城市出行提供了新的解决方案. 网约车平台通过智能手机应用程序提供便捷的叫车服务, 能够更好地将用户需求与即时运力相匹配. 在拼车出行服务中, 乘客可以合乘同一辆车, 将各自的目的地作为途径点, 以提高车辆的利用率. 文章提出了一种基于自注意力强化学习网络的网约车订单合乘及派单优化模型. 首先, 构建了网约车合乘出行拓扑网络, 考虑乘客的上下车时间、地点等因素, 设计了按需合乘动态匹配算法, 识别网约车潜在合乘订单. 然后, 构建了基于自注意力强化学习网络优化网约车派单, 采用策略梯度算法进行学习和训练, 在派单过程中引入掩码方法保证派单决策的有效性, 依托其“离线训练+在线决策”的优势, 实现大规模网约车派单问题的高效求解. 最后, 基于北京市网约车订单数据进行了实际案例研究, 结果表明, 基于自注意力强化学习网络的派单算法在保证路径接近最优的同时, 求解时间满足即时派单需求. 网约车订单合乘和派单优化可以有效减少车辆的行驶距离和车队规模, 尽管订单合乘略微增加了乘客的等待时间, 但是在提高网约车的运营效率、缓解交通拥堵、减少环境污染等方面具有明显的促进作用.