• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

于乃功 (于乃功.) (Scholars:于乃功) | 王琛 (王琛.) | 默凡凡 (默凡凡.) | 蔡建羡 (蔡建羡.)

Indexed by:

CQVIP PKU CSCD

Abstract:

针对Q学习算法在动态连续环境中应用时因状态连续、数量过多,导致Q值表出现存储空间不足和维数灾的问题,提出了一种新的Q值表设计方法,并设计了适用于连续环境的R值和动作.不同于以状态-动作为索引,将时间离散化为时刻,以时刻-动作为索引来建立Q值表.将在某状态应选择某一动作的问题转化为在某时刻应选择某一动作的问题,实现了Q学习算法在动态连续环境中的应用.采用了先利用遗传算法进行静态全局路径规划,然后利用Q学习算法进行动态避障.整个方法为一种先"离线"后"在线"的分层路径规划方法,成功实现了移动机器人的路径规划.仿真结果验证了所提出方法的有效性.

Keyword:

Q学习算法 路径规划 连续环境 动态环境

Author Community:

  • [ 1 ] 北京工业大学信息学部
  • [ 2 ] 北京工业大学计算智能与智能系统北京重点实验室

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

北京工业大学学报

Year: 2017

Issue: 07

Volume: 43

Page: 1009-1016

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 13

Online/Total:1564/10543219
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.