首页    期刊浏览 2025年07月13日 星期日
登录注册

文章基本信息

  • 标题:SVRを適用したFALCONによるトランプゲームに対する学習実験
  • 作者:笠原 和真 ; 二本 健太 ; 伊藤 崇
  • 期刊名称:知能と情報
  • 印刷版ISSN:1347-7986
  • 电子版ISSN:1881-7203
  • 出版年度:2018
  • 卷号:30
  • 期号:4
  • 页码:643-651
  • DOI:10.3156/jsoft.30.4_643
  • 语种:Japanese
  • 出版社:Japan Society for Fuzzy Theory and Intelligent Informatics
  • 摘要:

    本論文では,多人数不完全情報ゲームであるトランプゲームのハーツにおいて,FALCON(a Fusion Architecture for Learning, COgnition, and Navigation)を用いた学習エージェントの学習精度を向上させるための手法を提案している.FALCONは,強化学習の手法の1つであるファジイART(Adaptive Resonance Theory)を拡張した機械学習法である.知覚,行動,報酬の全てのベクトルに対して同時に複数のマッピングを学習することにより,知覚状態空間の離散化及び行動規則の学習を同時に行うことができる.既存研究において,トランプゲームのハーツに対するFALCONの有効性が示され,あらかじめ設定されたルールに基づいて行動するエージェントに勝つことに成功している.しかしながら,モンテカルロシミュレーションにより行動を決定するエージェントに勝つことはできなかった.本研究では,学習エージェントの性能向上のための改良として,実際のハーツにおける戦略に基づいた行動種類の変更と,学習時における行動選択に対してサポートベクター回帰による予測を適用する手法を提案する.これらの改良を用いる場合と用いない場合とで学習実験を行い,学習エージェントの性能の比較を行う.

  • 关键词:強化学習;ファジィART;FALCON;多人数不完全情報ゲーム;サポートベクター回帰;reinforcement learning;fuzzy ART;multi-player imperfect-information game;support vector regression
Loading...
联系我们|关于我们|网站声明
国家哲学社会科学文献中心版权所有