本論文では,多人数不完全情報ゲームであるトランプゲームのハーツにおいて,FALCON(a Fusion Architecture for Learning, COgnition, and Navigation)を用いた学習エージェントの学習精度を向上させるための手法を提案している.FALCONは,強化学習の手法の1つであるファジイART(Adaptive Resonance Theory)を拡張した機械学習法である.知覚,行動,報酬の全てのベクトルに対して同時に複数のマッピングを学習することにより,知覚状態空間の離散化及び行動規則の学習を同時に行うことができる.既存研究において,トランプゲームのハーツに対するFALCONの有効性が示され,あらかじめ設定されたルールに基づいて行動するエージェントに勝つことに成功している.しかしながら,モンテカルロシミュレーションにより行動を決定するエージェントに勝つことはできなかった.本研究では,学習エージェントの性能向上のための改良として,実際のハーツにおける戦略に基づいた行動種類の変更と,学習時における行動選択に対してサポートベクター回帰による予測を適用する手法を提案する.これらの改良を用いる場合と用いない場合とで学習実験を行い,学習エージェントの性能の比較を行う.