• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

杨来义 (杨来义.) | 毕敬 (毕敬.) | 苑海涛 (苑海涛.)

Abstract:

为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题,提出一种新的路径规划算法.基于深度强化学习SAC(soft actor-critic)算法,旨在解决机器人面对具有静态和动态障碍物的复杂环境时,路径规划表现差的问题.为使机器人快速躲避障碍物且到达目标,设计合理的奖励函数,使用动态的状态归一化和优先级经验技术.为评估该算法性能,构建基于Pygame的仿真环境.将所提算法与近端策略优化(proximal policy optimization,PPO)算法进行比较.实验结果表明:所提算法的累计奖励能够得到显著提高,并且具有更强的鲁棒性.

Keyword:

移动机器人 路径规划 连续奖励函数 深度强化学习 SAC(soft actor-critic)算法

Author Community:

  • [ 1 ] [苑海涛]北京航空航天大学
  • [ 2 ] [杨来义]北京工业大学
  • [ 3 ] [毕敬]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

系统仿真学报

ISSN: 1004-731X

Year: 2023

Issue: 8

Volume: 35

Page: 1726-1736

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 21

Online/Total:945/10531895
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.