出版社:Japan Society for Fuzzy Theory and Intelligent Informatics
摘要:時系列データとは,時間変化する現象の情報を持つデータであり,その応用範囲は多岐にわたる.大規模複雑な時系列データを分析し,その特徴を抽出するデータ解析手法の1つにクラスタリングがある.時系列データのクラスタリングにおける重要な課題は,適切な非類似度の選択とデータに適したクラスタリングアルゴリズムの選択である.本論文では,時系列データに対するクラスタリング手法にサイズコントロールの考え方を導入することで,不均衡な時系列データを適切に処理する新たなクラスタリング手法を提案する.提案手法は,時系列データに対する代表的な手法である,Dynamic Time Warping(DTW)を非類似度に用いた k -medoids,Shape-based Distance(SBD)を非類似度に用いた k -medoidsおよび k -Shapeのそれぞれを拡張することで構築される.さらに,UCR Time Series Classification Archiveで公開されている12種類のデータセットを用いた数値実験を行い,提案手法の性能を検証した.数値実験から,Dynamic Time Warpingを非類似度に用いたサイズコントロール付き k -medoidsが,提案手法の中で最も良好なクラスタ分割を得ることを確認した.
关键词:時系列データ;クラスタリング;サイズコントロール;Shape-based Distance;Dynamic Time Warping;time-series data;clustering;controlled-sized;shape-based distance;dynamic time warping