• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

李鹏 (李鹏.) | 阮晓钢 (阮晓钢.) (Scholars:阮晓钢) | 朱晓庆 (朱晓庆.) | 柴洁 (柴洁.) | 任顶奇 (任顶奇.) | 刘鹏飞 (刘鹏飞.)

Indexed by:

EI Scopus CSCD

Abstract:

针对移动机器人在分布式环境中的导航问题,提出一种基于深度强化学习的区域化视觉导航方法.首先,根据分布式环境特征,在不同区域内独立学习控制策略,同时构建区域化模型,实现导航过程中控制策略的切换和结合.然后,为使机器人具有更好的目标导向行为,在区域导航子模块中增加奖励预测任务,并结合经验池回放奖励序列.最后,在原有探索策略的基础上添加景深约束,防止因碰撞导致的遍历停滞.结果表明:奖励预测和景深避障的应用有助于提升导航性能.在多区域环境测试过程中,区域化模型在训练时间和所获奖励上展现出单一模型不具备的优势,表明其能更好地应对大范围导航.此外,实验在第一人称视角的3D环境下进行,状态是部分可观察的,利于实际应用.

Keyword:

分布式环境 区域化模型 景深避障 深度强化学习 奖励预测

Author Community:

  • [ 1 ] [李鹏]北京工业大学
  • [ 2 ] [阮晓钢]北京工业大学
  • [ 3 ] [朱晓庆]北京工业大学
  • [ 4 ] [柴洁]北京工业大学
  • [ 5 ] [任顶奇]北京工业大学
  • [ 6 ] [刘鹏飞]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

上海交通大学学报

ISSN: 1006-2467

Year: 2021

Issue: 5

Volume: 55

Page: 575-585

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count: 7

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 10

Online/Total:805/10615540
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.