Abstract:
为完成未知环境下救援物资的运输任务,研究了基于深度强化学习的多机器人路径规划方法.首先选用多智能体深度确定性策略梯度算法MADDPG算法为基础算法,然后针对算法存在的收敛速度慢甚至不收敛问题,引入了碰撞发生区域重点训练、经验池分离机制和优先经验回放等改进措施.最后基于Gazebo三维仿真平台搭建了两种仿真环境,并从训练结果和测试结果两个方面对改进算法与原始算法进行了对比分析.实验结果显示:改进算法相比于原始算法在各仿真环境中的任务成功率分别提高了 21%和 32%,平均路径长度分别缩短了12%和 17%,这证明了改进算法可以有效提高算法的收敛速度以及机器人的避障能力,从而更好地应用于多台物资配送车辆的路径规划.
Keyword:
Reprint Author's Address:
Email:
Source :
计算机仿真
ISSN: 1006-9348
Year: 2024
Issue: 8
Volume: 41
Page: 458-465
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 10
Affiliated Colleges: