基于改进MADDPG的多机器人路径规划方法研究 - Details

Author：

贾思雨 (贾思雨.) | 毕凌滔 (毕凌滔.) | 曹扬 (曹扬.) | 吕乃冰 (吕乃冰.)

Abstract：

为完成未知环境下救援物资的运输任务,研究了基于深度强化学习的多机器人路径规划方法.首先选用多智能体深度确定性策略梯度算法MADDPG算法为基础算法,然后针对算法存在的收敛速度慢甚至不收敛问题,引入了碰撞发生区域重点训练、经验池分离机制和优先经验回放等改进措施.最后基于Gazebo三维仿真平台搭建了两种仿真环境,并从训练结果和测试结果两个方面对改进算法与原始算法进行了对比分析.实验结果显示:改进算法相比于原始算法在各仿真环境中的任务成功率分别提高了　21%和　32%,平均路径长度分别缩短了12%和　17%,这证明了改进算法可以有效提高算法的收敛速度以及机器人的避障能力,从而更好地应用于多台物资配送车辆的路径规划.

Keyword：

多智能体深度确定性策略梯度多机器人路径规划深度强化学习

Author Community：

[ 1 ] [贾思雨]北京航天晨信科技有限责任公司,北京 102308
[ 2 ] [曹扬]北京航天晨信科技有限责任公司,北京 102308
[ 3 ] [毕凌滔]北京工业大学
[ 4 ] [吕乃冰]北京航天晨信科技有限责任公司,北京 102308

Reprint Author's Address：

Email：

Show more details

Related Keywords：

Source ：

计算机仿真

ISSN： 1006-9348

Year： 2024

Issue： 8

Volume： 41

Page： 458-465

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 10

Affiliated Colleges：

学院待认领

Get Fulltext

Library Discovery Baidu Scholar Search WF WF WF WF WF WF

Type
Departments

All Years Choose Year From to