Advanced value iteration for discrete-time intelligent critic control: A survey - Details

Author：

Zhao, Mingming (Zhao, Mingming.) | Wang, Ding (Wang, Ding.) (Scholars：王鼎) | Qiao, Junfei (Qiao, Junfei.) | Ha, Mingming (Ha, Mingming.) | Ren, Jin (Ren, Jin.)

Indexed by：

EI Scopus SCIE

Abstract：

Optimal　control　problems　are　ubiquitous　in　practical　engineering　applications　and　social　life　with　the　idea　of　cost　or　resource　conservation.　Based　on　the　critic　learning　scheme,　adaptive　dynamic　programming　(ADP)　is　regarded　as　a　significant　avenue　to　address　the　optimal　control　problems　by　combining　the　advanced　design　ideas　such　as　adaptive　control,　reinforcement　learning,　and　intelligent　control.　This　survey　introduces　the　recent　development　of　ADP　and　related　intelligent　critic　control　with　an　emphasis　on　advanced　value　iteration　(VI)　schemes　for　discrete-time　nonlinear　systems.　The　theoretical　results　focus　on　convergence　and　stability　properties　for　general　VI,　stabilizing　VI,　integrated　VI,　evolving　VI,　adjustable　VI　schemes　and　so　on.　Several　significant　applications　are　also　elaborated　in　aspects　of　optimal　regulation,　optimal　tracking,　and　zero-sum　games.　We　aim　to　break　through　the　bottleneck　problems　for　VI　algorithms　in　realizing　evolving　control,　accelerating　learning　speed,　and　reducing　the　calculation　expense.　In　addition,　the　prospects　of　new　theoretical　and　technical　fields　for　advanced　VI　schemes　are　looked　ahead.

Keyword：

Optimal control Adaptive dynamic programming Advanced value iteration

Author Community：

[ 1 ] [Zhao, Mingming]Beijing Univ Technol, Fac Informat Technol, Beijing 100124, Peoples R China
[ 2 ] [Wang, Ding]Beijing Univ Technol, Fac Informat Technol, Beijing 100124, Peoples R China
[ 3 ] [Qiao, Junfei]Beijing Univ Technol, Fac Informat Technol, Beijing 100124, Peoples R China
[ 4 ] [Ren, Jin]Beijing Univ Technol, Fac Informat Technol, Beijing 100124, Peoples R China
[ 5 ] [Zhao, Mingming]Beijing Univ Technol, Beijing Key Lab Computat Intelligence & Intelligen, Beijing 100124, Peoples R China
[ 6 ] [Wang, Ding]Beijing Univ Technol, Beijing Key Lab Computat Intelligence & Intelligen, Beijing 100124, Peoples R China
[ 7 ] [Qiao, Junfei]Beijing Univ Technol, Beijing Key Lab Computat Intelligence & Intelligen, Beijing 100124, Peoples R China
[ 8 ] [Ren, Jin]Beijing Univ Technol, Beijing Key Lab Computat Intelligence & Intelligen, Beijing 100124, Peoples R China
[ 9 ] [Zhao, Mingming]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China
[ 10 ] [Wang, Ding]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China
[ 11 ] [Qiao, Junfei]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China
[ 12 ] [Ren, Jin]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China
[ 13 ] [Zhao, Mingming]Beijing Univ Technol, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 14 ] [Wang, Ding]Beijing Univ Technol, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 15 ] [Qiao, Junfei]Beijing Univ Technol, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 16 ] [Ren, Jin]Beijing Univ Technol, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 17 ] [Ha, Mingming]Univ Sci & Technol Beijing, Sch Automation & Elect Engn, Beijing 100083, Peoples R China

Reprint Author's Address：

Email：

dingwang@bjut.edu.cn

Show more details

Related Keywords：

Improved value iteration for neural-network-based stochastic optimal control design
2020，NEURAL NETWORKS
Robust Policy Learning Control Design for Multiplayer Nonzero-Sum Games with Uncertainties
2023，
Adaptive-Critic-Based Robust Control with Momentum Gradient Descent for Continuous-Time Nonlinear Systems
2024，2024 43RD CHINESE CONTROL CONFERENCE, CCC 2024
Adaptive-Critic-Based Robust Control with Momentum Gradient Descent for Continuous-Time Nonlinear Systems
2024，

Source ：

ARTIFICIAL INTELLIGENCE REVIEW

ISSN： 0269-2821

Year： 2023

Issue： 10

Volume： 56

Page： 12315-12346

1 2 . 0 0 0

JCR@2022

ESI Discipline： COMPUTER SCIENCE;

ESI HC Threshold：19

Cited Count：

WoS CC Cited Count： 44

SCOPUS Cited Count： 52

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 11

Affiliated Colleges：

Get Fulltext

DOI Library Discovery Baidu Scholar Search Web of Science

Type
Departments

All Years Choose Year From to