文章基本信息

标题：SVRを適用したFALCONによるトランプゲームに対する学習実験
作者：笠原和真 ; 二本健太 ; 伊藤崇等
期刊名称：知能と情報
印刷版ISSN：1347-7986
电子版ISSN：1881-7203
出版年度：2018
卷号：30
期号：4
页码：643-651
DOI：10.3156/jsoft.30.4_643
语种：Japanese
出版社：Japan Society for Fuzzy Theory and Intelligent Informatics
摘要：

本論文では，多人数不完全情報ゲームであるトランプゲームのハーツにおいて，FALCON（a Fusion Architecture for Learning, COgnition, and Navigation）を用いた学習エージェントの学習精度を向上させるための手法を提案している．FALCONは，強化学習の手法の1つであるファジイART(Adaptive Resonance Theory)を拡張した機械学習法である．知覚，行動，報酬の全てのベクトルに対して同時に複数のマッピングを学習することにより，知覚状態空間の離散化及び行動規則の学習を同時に行うことができる．既存研究において，トランプゲームのハーツに対するFALCONの有効性が示され，あらかじめ設定されたルールに基づいて行動するエージェントに勝つことに成功している．しかしながら，モンテカルロシミュレーションにより行動を決定するエージェントに勝つことはできなかった．本研究では，学習エージェントの性能向上のための改良として，実際のハーツにおける戦略に基づいた行動種類の変更と，学習時における行動選択に対してサポートベクター回帰による予測を適用する手法を提案する．これらの改良を用いる場合と用いない場合とで学習実験を行い，学習エージェントの性能の比較を行う．
关键词：強化学習;ファジィART;FALCON;多人数不完全情報ゲーム;サポートベクター回帰;reinforcement learning;fuzzy ART;multi-player imperfect-information game;support vector regression