一种基于动作约束的离线多智能体强化学习方法 - Details

Author：

韩雨 (韩雨.) | 高若云 (高若云.) | 王逸飞 (王逸飞.) | 袁帅 (袁帅.) | 任柯燕 (任柯燕.)

Indexed by：

incoPat zhihuiya

Abstract：

本发明公开一种基于动作约束的离线多智能体强化学习方法。根据QMIX网络，实现基于动作约束的多智能体离线强化学习方法的训练；该方法依据在离线强化学习中将动作约束在离线数据集中可以有效减少外推误差这一特点，通过变分自编码器进行动作约束，并进一步结合中心训练分布式执行的方法。进而达到各智能体在训练中仅依靠所拥有的离线数据去训练智能体，从而达到不需要与环境进行进一步交互和探索的目的。进而提升网络训练效果，降低多智能体算法在离线训练下的难度。

Keyword：

Reprint Author's Address：

Email：

Show more details

Related Keywords：

Patent Info ：

Type：发明申请

Patent No.： CN202111683837.7

Filing Date： 2021-12-29

Publication Date： 2024-07-09

Pub. No.： CN114386620B

Applicants：北京工业大学

Legal Status：授权

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 7

Affiliated Colleges：

学院待认领

Get Patent

Library Discovery Baidu Scholar Search incoPat Download Full text

Type
Departments

All Years Choose Year From to