Indexed by:
Abstract:
本发明公开一种基于动作约束的离线多智能体强化学习方法。根据QMIX网络,实现基于动作约束的多智能体离线强化学习方法的训练;该方法依据在离线强化学习中将动作约束在离线数据集中可以有效减少外推误差这一特点,通过变分自编码器进行动作约束,并进一步结合中心训练分布式执行的方法。进而达到各智能体在训练中仅依靠所拥有的离线数据去训练智能体,从而达到不需要与环境进行进一步交互和探索的目的。进而提升网络训练效果,降低多智能体算法在离线训练下的难度。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明申请
Patent No.: CN202111683837.7
Filing Date: 2021-12-29
Publication Date: 2024-07-09
Pub. No.: CN114386620B
Applicants: 北京工业大学
Legal Status: 授权
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 7
Affiliated Colleges: