Abstract:
为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题,提出一种新的路径规划算法.基于深度强化学习SAC(soft actor-critic)算法,旨在解决机器人面对具有静态和动态障碍物的复杂环境时,路径规划表现差的问题.为使机器人快速躲避障碍物且到达目标,设计合理的奖励函数,使用动态的状态归一化和优先级经验技术.为评估该算法性能,构建基于Pygame的仿真环境.将所提算法与近端策略优化(proximal policy optimization,PPO)算法进行比较.实验结果表明:所提算法的累计奖励能够得到显著提高,并且具有更强的鲁棒性.
Keyword:
Reprint Author's Address:
Email:
Source :
系统仿真学报
ISSN: 1004-731X
Year: 2023
Issue: 8
Volume: 35
Page: 1726-1736
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: -1
Chinese Cited Count:
30 Days PV: 21