基于多智能体强化学习的新强化函数设计 - Details

Author：

左国玉 (左国玉.) | 张红卫 (张红卫.) | 韩光胜 (韩光胜.)

Indexed by：

CQVIP PKU CSCD

Abstract：

为了提高强化学习算法在多智能体系统中的性能表现,针对典型的多智能体系统一Keepaway平台总是以失败告终的特点,受与之有相同特点的单智能体系统杆平衡系统所采用强化函数的启发,重新设计一种新的惩罚式的强化函数.新的强化函数在系统成功状态时设零值奖赏,失败状态时给与负值惩罚.基于新设计的强化函数的Sarsa(A)算法成功应用在Keepaway平台上.仿真结果表明,新设计的强化函数在一定参数条件下有效提高了强化学习算法栽Keepaway平台的性能表现.其最终的学习效果更好.

Keyword：

强化函数 Keepaway 强化学习多智能体系统 Robocup

Author Community：

[ 1 ] [左国玉]北京工业大学
[ 2 ] [张红卫]北京工业大学
[ 3 ] [韩光胜]北京工业大学

Reprint Author's Address：

Email：

Show more details

Related Keywords：

Q学习中基于模糊规则的强化函数设计方法
2008，模式识别与人工智能
基于Agent控制器的单路口信号灯学习控制方法研究
2007，交通与计算机
基于ASPL模型的多智能体强化学习在RoboCup中的应用
2005，2005中国机器人大赛
多智能体强化学习在机器人足球比赛中的应用
2005，2005年中国智能自动化会议

Source ：

控制工程

ISSN： 1671-7848

Year： 2009

Issue： 2

Volume： 16

Page： 239-242

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： 9

Chinese Cited Count：

30 Days PV： 3

Affiliated Colleges：

Get Fulltext

DOI Library Discovery Baidu Scholar Search WF

Type
Departments

All Years Choose Year From to