首页    期刊浏览 2024年10月01日 星期二
登录注册

文章基本信息

  • 标题:行動則の獲得状況を考慮した自己組織化マップによる状態空間構成法
  • 本地全文:下载
  • 作者:斉藤 史哲 ; 長谷川 修
  • 期刊名称:知能と情報
  • 印刷版ISSN:1347-7986
  • 电子版ISSN:1881-7203
  • 出版年度:2008
  • 卷号:20
  • 期号:3
  • 页码:369-378
  • DOI:10.3156/jsoft.20.369
  • 出版社:Japan Society for Fuzzy Theory and Intelligent Informatics
  • 摘要:

    強化学習エージェントの状態空間構成に自己組織化マップ(Self-Organizing Map:SOM)などの競合学習を行うニューラルネットを用いる方法が近年多く報告されている.これらの方法では強化学習器に Q-learningなどの環境同定型の強化学習を用いることが前提とされており,Profit Sharingにおける状態空間構成にSOMを使用したときは行動規則の学習の速さをSOMの学習が追従できない.そこで本研究では,SOMを Profit Sharingによる強化学習エージェントの状態空間構成に利用した場合においても,SOMがProfit Sharingの学習の速さを追従可能とするための“相互学習残参照型近傍関数”を提案し,その有効性をシミュレーションタスクでの実験により示す.

  • 关键词:自己組織化マップ; 強化学習; Profit Sharing; 近傍関数; 状態空間構成
国家哲学社会科学文献中心版权所有