不对称约束多人非零和博弈的自适应评判控制 - Details

Author：

李梦花 (李梦花.) | 王鼎 (王鼎.) | 乔俊飞 (乔俊飞.)

Abstract：

本文针对连续时间非线性系统的不对称约束多人非零和博弈问题,建立了一种基于神经网络的自适应评判控制方法.首先,本文提出了一种新颖的非二次型函数来处理不对称约束问题,并且推导出最优控制律和耦合Hamilton-Jacobi方程.值得注意的是,当系统状态为零时,最优控制策略是不为零的,这与以往不同.然后,通过构建单一评判网络来近似每个玩家的最优代价函数,从而获得相关的近似最优控制策略.同时,在评判学习期间发展了一种新的权值更新规则.此外,通过利用Lyapunov理论证明了评判网络权值近似误差和闭环系统状态的稳定性.最后,仿真结果验证了本文所提方法的有效性.

Keyword：

非线性系统不对称约束神经网络多人非零和博弈自适应评判控制自适应动态规划

Author Community：

[ 1 ] [乔俊飞]北京工业大学信息学部,北京 100124;计算智能与智能系统北京市重点实验室,北京 100124;智慧环保北京实验室,北京 100124;北京人工智能研究院,北京 100124
[ 2 ] [王鼎]北京工业大学信息学部,北京 100124;计算智能与智能系统北京市重点实验室,北京 100124;智慧环保北京实验室,北京 100124;北京人工智能研究院,北京 100124
[ 3 ] [李梦花]北京工业大学信息学部,北京 100124;计算智能与智能系统北京市重点实验室,北京 100124;智慧环保北京实验室,北京 100124;北京人工智能研究院,北京 100124

Reprint Author's Address：

Email：

Show more details

Related Keywords：

Source ：

控制理论与应用

ISSN： 1000-8152

Year： 2023

Issue： 9

Volume： 40

Page： 1562-1568

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： -1

Chinese Cited Count：

30 Days PV： 21

Affiliated Colleges：

信息科学技术学院本学院/部未明确归属的数据

北京人工智能研究院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search WF WF WF WF WF WF WF WF

Type
Departments

All Years Choose Year From to