CVPR 2025|MomAD:动量感知规划的端到端自动驾驶

2025/03/13

7659323e-0d1a-48d1-8714-34defa1556e9.webp

cbe2fe05-d7ca-4d2d-946a-ab737ce0d51d.webp


• 论文链接:

https://arxiv.org/abs/2503.03125

• 论文代码:

https://github.com/adept-thu/MomAD



研究背景

自动驾驶技术经历了从模块化到更集成化的端到端范式的转变。传统方法将检测、跟踪、地图构建、运动预测和规划等任务分开处理,而端到端框架则强调这些任务的无缝集成。通过优先考虑规划,端到端框架能够战略性地引导来自上游感知模块的信息,从而增强动态驾驶环境中的鲁棒性和可靠性。高质量的规划依赖于准确预测自车未来的轨迹,这需要对静态和动态环境因素(如地图元素和与周围交通参与者的交互)有长远的理解。


然而,由于其他道路使用者意图的不确定性、道路条件的变化以及人类驾驶行为引入的模糊性,轨迹预测本质上是随机的,这使得确定性预测变得次优甚至具有风险。现有的多模态轨迹规划方法虽然能够考虑多种可能的交通参与者行为,但它们通常是基于当前感知帧的一次性预测,容易受到遮挡或关键视觉线索丢失的影响,导致轨迹质量下降。此外,缺乏时间一致性可能导致连续轨迹缺乏连贯性,引发不稳定的车辆控制。为了解决这些问题,本文提出了动量感知驾驶框架 (MomAD) ,通过引入轨迹动量和感知动量来稳定和优化轨迹预测,从而在动态驾驶环境中实现更平滑和一致的规划结果。


fc0e454a-e790-402c-8af7-5ba162da168c.webp


根据上图对比我们可以看到,(a) 确定性规划的方案,缺乏动作多样性,存在安全风险;(b) 多模态轨迹规划方案,通过选择最高分轨迹,但存在大分数偏移问题导致稳定性不足;(c) 我们提出的MomAD巧妙利用“惯性”的思想,通过动量规划,利用历史和感知动量提升时序一致性,解决端到端自动驾驶中不稳定行驶的问题。



研究方法

Topological Trajectory Matching

该模块通过Hausdorff距离选择与历史路径匹配的多模态轨迹提案,以确保时序一致性和轨迹的连续性。具体来说,TTM模块通过小化不同时间步之间的规划差异,防止轨迹偏离历史轨迹。


Momentum Planning Interactor

该模块通过长时查询混合器将当前最佳规划查询与历史规划查询进行交叉注意力处理,扩展静态和动态感知文件,从而丰富当前查询的上下文信息。MPI模块通过结合历史查询和当前查询,生成改进的轨迹预测,增强了对周围环境的感知能力。


Robust Instance Denoising via 

Perturbation

在训练过程中引入受控噪声扰动,使模型能够区分关键和无关特征,提高对感知噪声的鲁棒性。通过这种方式,模型在测试时能够更好地应对实例特征的波动,生成更稳定和平滑的轨迹。


5b688cb7-a116-47b9-9078-e60f213a8a78.webp



结果与分析

c50bb5bd-ac30-4484-b125-faed4eea74b8.webp


如表所示,MomAD在L2误差、碰撞率和TPC(轨迹预测一致性)上分别达到了0.60米、0.09%和0.54米。与UniAD、VAD和SparseDrive等最先进方法相比,我们的方法在规划结果上表现出色。值得注意的是,我们在TPC指标上取得了显著改进,在nuScenes数据集上1秒、2秒和3秒的TPC分别提升了0.30米、0.53米和0.78米,直接证明了我们在时间一致性方面的有效性。


总体而言,MomAD有效利用了动量的平滑优势,在提升时间一致性方面效果显著。


983e3a3f-fb9f-46c1-b0ed-6ccbe6e96623.webp


准确的长轨迹预测对于提升自动驾驶的稳定性至关重要,同时也有助于评估模型解决多模态轨迹规划中时间一致性问题的能力。如表所示,我们在nuScenes和Turning-nuScenes数据集上对比了SparseDrive和MomAD在4-6秒长轨迹预测中的表现,结果显示MomAD在性能上有显著提升。


具体而言,在nuScenes数据集中,与SparseDrive相比,MomAD在4秒、5秒和6秒的L2误差分别降低了0.09米(5.14%)、0.34米(14.66%)和0.50米(16.95%),碰撞率分别降低了0.04%、0.11%和0.20%,TPC(轨迹预测一致性)分别降低了0.14米(10.53%)、0.21米(12.65%)和0.38米(19.10%)。


此外,在Turning-nuScenes数据集中,与SparseDrive相比,MomAD在4秒、5秒和6秒的L2误差分别降低了0.27米(13.04%)、0.64米(23.62%)和0.85米(25.30%),碰撞率分别降低了0.06%、0.14%和0.26%,TPC分别降低了0.17米(11.04%)、0.73米(31.60%)和0.97米(32.45%)。


可以观察到,MomAD在更远距离的轨迹预测上表现显著提升,尤其是在6秒时的改进幅度大。总体而言,MomAD提升了长轨迹预测的性能,进一步证明了其能够有效缓解时间一致性问题。


3e246ff4-ebd1-4b7e-8b54-e467443b6ec2.webp


我们已在Bench2Drive数据集上进行了具有挑战性的闭环评估,结果如表所示。该数据集涵盖44个交互场景,例如切入、超车、绕行,以及220条路线,覆盖多种天气条件和地点。我们的MomAD框架在成功率上分别比VAD多模态变体和SparseDrive分别提高了16.3%和8.4%,并在舒适度评分(轨迹平滑度)上分别提升了7.2%和5.3%,证明了其有效性。



结论

MomAD框架通过引入轨迹动量和感知动量,显著提高了端到端自动驾驶系统在轨迹规划中的稳定性和鲁棒性。未来工作将探索扩散模型和推测解码方法,以进一步提高轨迹多样性和效率。

             
.

分享文章

欢迎订阅地平线相关资讯,您可以随时取消订阅。

立即订阅

同意隐私政策,允许向我推送地平线的新闻、资讯及更多内容。

提交成功!

感谢您的订阅, 我们会第一时间推送地平线最新活动与资讯到您邮箱

6-1.jpg 618db6f9-665a-4ec5-a04a-bb65a3df9030.jpg