Discounted linear Q-learning control with novel tracking cost and its stability - Details

Author：

Wang, Ding (Wang, Ding.) (Scholars：王鼎) | Ren, Jin (Ren, Jin.) | Ha, Mingming (Ha, Mingming.)

Indexed by：

EI Scopus SCIE

Abstract：

In　this　article,　in　order　to　achieve　optimal　tracking　control　of　unknown　linear　discrete　sys-tems,　a　model-free　scheme　based　on　Q-learning　is　established　online.　First,　we　introduce　an　innovative　performance　index　function,　so　as　to　eliminate　the　tracking　error　and　avert　the　calculation　for　stable　control　policies　of　the　reference　trajectory.　Taking　value　iteration　and　policy　iteration　into　consideration,　the　corresponding　model-based　approaches　are　derived.　Then,　the　Q-function　is　developed　and　the　model-free　algorithm　utilizing　Q-learning　is　given　for　the　sake　of　dealing　with　the　linear　quadratic　tracking　(LQT)　problem　online　with-out　relying　on　system　dynamics　information.　In　addition,　novel　stability　analysis　based　on　Q-learning　is　provided　for　the　discounted　LQT　control　issue　and　the　probing　noise　is　demonstrated　that　it　does　not　result　in　any　excitation　noise　bias.　Finally,　by　means　of　con-ducting　numerical　simulation,　the　proposed　Q-learning　algorithm　is　demonstrated　to　be　effective　and　practicable.(c)　2023　Elsevier　Inc.　All　rights　reserved.

Keyword：

Model -free control Discounted linear quadratic tracking Adaptive critic Q-function Reinforcement learning

Author Community：

[ 1 ] [Wang, Ding]Beijing Univ Technol, Fac Informat Technol, Beijing 100124, Peoples R China
[ 2 ] [Ren, Jin]Beijing Univ Technol, Fac Informat Technol, Beijing 100124, Peoples R China
[ 3 ] [Wang, Ding]Beijing Univ Technol, Beijing Key Lab Computat Intelligence & Intelligen, V 100124, Peoples R China
[ 4 ] [Ren, Jin]Beijing Univ Technol, Beijing Key Lab Computat Intelligence & Intelligen, V 100124, Peoples R China
[ 5 ] [Wang, Ding]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China
[ 6 ] [Ren, Jin]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China
[ 7 ] [Wang, Ding]Beijing Univ Technol, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 8 ] [Ren, Jin]Beijing Univ Technol, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 9 ] [Ha, Mingming]Univ Sci & Technol Beijing, Sch Automation & Elect Engn, Beijing 100083, Peoples R China

Reprint Author's Address：

[Wang, Ding]Beijing Univ Technol, Fac Informat Technol, Beijing 100124, Peoples R China;;

Email：

dingwang@bjut.edu.cn |
renjin@emails.bjut.edu.cn |
hamingming_0705@foxmail.com

Show more details

Related Keywords：

Research Progress on Learning-based Robust Adaptive Critic Control
2019，Acta Automatica Sinica
Adaptive critic design with weight allocation for intelligent learning control of wastewater treatment plants
2024，Engineering Applications of Artificial Intelligence
Novel Discounted Adaptive Critic Control Designs With Accelerated Learning Formulation
2023，IEEE TRANSACTIONS ON CYBERNETICS
Discounted Iterative Adaptive Critic Designs With Novel Stability Analysis for Tracking Control
2022，IEEE-CAA JOURNAL OF AUTOMATICA SINICA

Source ：

INFORMATION SCIENCES

ISSN： 0020-0255

Year： 2023

Volume： 626

Page： 339-353

8 . 1 0 0

JCR@2022

ESI Discipline： COMPUTER SCIENCE;

ESI HC Threshold：19

Cited Count：

WoS CC Cited Count： 6

SCOPUS Cited Count： 8

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 2

Affiliated Colleges：

Get Fulltext

DOI Library Discovery Baidu Scholar Search Web of Science

Type
Departments

All Years Choose Year From to