基于Q-Learning的智能体训练
How to Train the Agent Based on the Way of Q-Learning
  修订日期:2006-11-06
中文关键词:Q-Learning 模糊控制 回报函数
英文关键词:Q-Learning  fuzzy control  reward function
基金项目:河北师范大学青年基金(L2004Q15)
赵增荣  韩提文
[1]河北师范大学职业技术学院,河北石家庄050031 [2]河北工业职业技术学院成教部,河北石家庄050030
摘要点击次数: 662
全文下载次数: 0
中文摘要:
      针对机器人足球比赛的多智能体环境下智能体的训练问题,提出了一种将模糊控制与Q-Learning相结合的学习方法,并在学习过程中自动调节回报函数以获得最优策略,此方法的有效性在中型组的仿真平台上得到了验证,并取得了较好效果,还可将它改进应用于其他多智体环境。
英文摘要:
      In order to solve the problem of agent training in the multi-agent circumstances of robot soccer, a new method of agent learning is put forward, which combines the fuzzy control with the Q-Learning. During the learning process, the reward function is cont
赵增荣,韩提文.基于Q-Learning的智能体训练[J].石家庄铁道大学学报:自然科学版,2007,(2):37-.
查看全文  查看/发表评论  下载PDF阅读器
关闭