首页    期刊浏览 2025年09月18日 星期四
登录注册

文章基本信息

  • 标题:状態の調整および状態と行動の組の削除機能を持つ動的ファジィQ-learning
  • 本地全文:下载
  • 作者:細谷 優 ; 馬野 元秀
  • 期刊名称:知能と情報
  • 印刷版ISSN:1347-7986
  • 电子版ISSN:1881-7203
  • 出版年度:2014
  • 卷号:26
  • 期号:5
  • 页码:844-854
  • DOI:10.3156/jsoft.26.844
  • 出版社:Japan Society for Fuzzy Theory and Intelligent Informatics
  • 摘要:

    近年,離散状態しか取り扱えないQ-learning を拡張し,連続状態を扱えるようにしたファジィ Q-learningに関する研究が行なわれている.また,初期のQ表を与えておき,新しい状態と行動の組を動的に追加していくDynamic Fuzzy Q-Learning (DFQL) も提案されている.我々は,状態のファジィ集合の調整と状態と行動の組の削除機能を持つ,より動的で柔軟なファジィQ-learningを提案する.提案法では, Q 値の学習を行ないながら状態の評価値である V 値のTD誤差を用いて状態のファジィ集合の中心値と幅の調整を行なう.そして,ファジィ集合と V 値に忘却学習を適用することで不要なファジィ集合と不要な状態と行動の組を削除する.この方法を実数値環境下の追跡問題に適用する.

  • 关键词:動的ファジィQ-learning; TD 誤差; 状態と行動の組の削除; 実数値環境; 追跡問題
国家哲学社会科学文献中心版权所有