Abstract:
城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视.针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法.首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法进行求解;其次,针对多对一的评论网络采用嵌入方法来解决空间维度不同的异构智能体决策评价问题;再次,在近端策略优化的基础上,增加了自适应采样来辅助策略的更新;最后,对演员网络进行权重继承操作以帮助智能体迅速接管相应的任务.实验结果表明,相较于其他方法,所提方法的奖励回报提高了22.67%,收敛速度加快了8.14%,不仅可以满足城市环境下多个智能体协作对抗的决策,还能够兼容多异构智能体的协作对抗.
Keyword:
Reprint Author's Address:
Email:
Source :
通信学报
ISSN: 1000-436X
Year: 2025
Issue: 3
Volume: 46
Page: 94-108
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 17
Affiliated Colleges: