• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

米广铭 (米广铭.) | 张辉 (张辉.) | 张菁 (张菁.) | 卓力 (卓力.)

Abstract:

城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视.针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法.首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法进行求解;其次,针对多对一的评论网络采用嵌入方法来解决空间维度不同的异构智能体决策评价问题;再次,在近端策略优化的基础上,增加了自适应采样来辅助策略的更新;最后,对演员网络进行权重继承操作以帮助智能体迅速接管相应的任务.实验结果表明,相较于其他方法,所提方法的奖励回报提高了22.67%,收敛速度加快了8.14%,不仅可以满足城市环境下多个智能体协作对抗的决策,还能够兼容多异构智能体的协作对抗.

Keyword:

协作对抗 深度强化学习 多智能体 近端策略优化 城市环境

Author Community:

  • [ 1 ] [张菁]北京工业大学信息科学技术学院,北京 100124;北京工业大学计算智能与智能系统北京市重点实验室,北京 100124
  • [ 2 ] [卓力]北京工业大学信息科学技术学院,北京 100124;北京工业大学计算智能与智能系统北京市重点实验室,北京 100124
  • [ 3 ] [米广铭]北京工业大学信息科学技术学院,北京 100124
  • [ 4 ] [张辉]北京工业大学信息科学技术学院,北京 100124;北京工业大学计算智能与智能系统北京市重点实验室,北京 100124

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

通信学报

ISSN: 1000-436X

Year: 2025

Issue: 3

Volume: 46

Page: 94-108

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 17

Affiliated Colleges:

Online/Total:1136/10634600
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.