Indexed by:
Abstract:
强化学习中基于马尔可夫决策过程的标准Q-Learning算法可以取得较优路径,但是方法存在收敛速度慢及规划效率低等问题,无法直接应用于真实环境.针对此问题,提出一种基于势能场知识的Q-Learning移动机器人路径规划算法.通过引入环境的势能值作为搜索启发信息对Q值进行初始化,从而在学习初期便能引导移动机器人快速收敛,改变了传统强化学习过程的盲目性,适用于真实环境中直接学习.仿真实验表明,与现有的算法相比,所提算法不仅提高了收敛速度,而且还缩短了学习时间,使得移动机器人能够迅速找到一条较优的无碰撞路径.
Keyword:
Reprint Author's Address:
Email:
Source :
电光与控制
ISSN: 1671-637X
Year: 2019
Issue: 9
Volume: 26
Page: 29-33
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 1
Chinese Cited Count:
30 Days PV: 13
Affiliated Colleges: