Indexed by:
Abstract:
在模型未知和没有先验经验的条件下,采用一种改进的强化学习算法实现二级倒立摆系统的平衡控制.该学习算法不需要预测和辨识模型,能通过网络自身的联想和记忆,在线寻求最优策略.该学习算法采用基于神经网络的值函数逼近,并用直接梯度和适合度轨迹修正权值,有效实现对连续状态和行为空间任务的控制.计算机仿真证明了该强化学习算法在较短的时间内即可成功地学会控制直线二级倒立摆系统.
Keyword:
Reprint Author's Address:
Email:
Source :
计算机仿真
ISSN: 1006-9348
Year: 2006
Issue: 4
Volume: 23
Page: 305-308
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 9
Chinese Cited Count:
30 Days PV: 5
Affiliated Colleges: