離散状態しか取り扱えないQ-learningを拡張し,連続状態を扱えるようにしたファジィQ-learningに関する研究が盛んに行なわれている. その中でもGlorennecらが提案したファジィQ-learningは多くの関連する研究に用いられている. 我々はこのGlorennecらの方法を改善した方法を提案する. そして,我々の方法を実数値空間における追跡問題に適用し,Glorennecらの方法と比較する.