首页    期刊浏览 2025年04月13日 星期日
登录注册

文章基本信息

  • 标题:多数のパラメータを用いるファジィ c 平均識別器の訓練データ数による性能比較
  • 本地全文:下载
  • 作者:市橋 秀友 ; 本多 克宏 ; 野津 亮
  • 期刊名称:知能と情報
  • 印刷版ISSN:1347-7986
  • 电子版ISSN:1881-7203
  • 出版年度:2011
  • 卷号:23
  • 期号:2
  • 页码:254-263
  • DOI:10.3156/jsoft.23.254
  • 出版社:Japan Society for Fuzzy Theory and Intelligent Informatics
  • 摘要:

    ファジィc平均識別器(Fuzzy c-Means Based Classifier, FCMC)はクラスタリングを基にした識別器であり,訓練データが大量であればクラスター数を多くすることで訓練データに対する精度を向上できると考えられ,そのような性能比較も行われている.一方,テストデータに対する性能(汎化性能)はクラスター数を増やしても必ずしも改善されない.特に比較的少量の訓練データではクラスター数を多くするとオーバーフィットするだけでなく,各クラスターに含まれる訓練データが少なくなるために,共分散行列やクラスター中心が正確に求まらず性能が悪くなる.クラス毎のクラスター数を2とし,1000件以下の訓練データでの性能は既に報告されている.本論文では大量訓練データを用いて訓練データ数が変化した場合の性能をクラス毎のクラスター数を8まで増やして比較する.訓練データが比較的少量の場合を考慮し,識別器はクラスター数を余り多くせずに,逆に訓練データに対して最適化するパラメータ数を多くした場合の比較とする.世界的に実用可能なツールとして認められているLibSVMを用いて,訓練データ数が変化することによるテストデータの識別精度と訓練時間とテスト時間(検出時間)への影響を比較する.訓練データが10倍になった時の訓練時間は,FCMCでは10倍になるが,LibSVMでは約100倍になる.

  • 关键词:識別器; サポートベクターマシン; 大量データ
国家哲学社会科学文献中心版权所有