ファジィc平均識別器(Fuzzy c-Means Based Classifier, FCMC)はクラスタリングを基にした識別器であり,訓練データが大量であればクラスター数を多くすることで訓練データに対する精度を向上できると考えられ,そのような性能比較も行われている.一方,テストデータに対する性能(汎化性能)はクラスター数を増やしても必ずしも改善されない.特に比較的少量の訓練データではクラスター数を多くするとオーバーフィットするだけでなく,各クラスターに含まれる訓練データが少なくなるために,共分散行列やクラスター中心が正確に求まらず性能が悪くなる.クラス毎のクラスター数を2とし,1000件以下の訓練データでの性能は既に報告されている.本論文では大量訓練データを用いて訓練データ数が変化した場合の性能をクラス毎のクラスター数を8まで増やして比較する.訓練データが比較的少量の場合を考慮し,識別器はクラスター数を余り多くせずに,逆に訓練データに対して最適化するパラメータ数を多くした場合の比較とする.世界的に実用可能なツールとして認められているLibSVMを用いて,訓練データ数が変化することによるテストデータの識別精度と訓練時間とテスト時間(検出時間)への影響を比較する.訓練データが10倍になった時の訓練時間は,FCMCでは10倍になるが,LibSVMでは約100倍になる.