電子コミックの市場規模が拡大する中で,漫画画像の内容を理解してメタデータを生成する技術の需要が高まっている.特に登場キャラクタはストーリーを理解する上で重要な要素の一つである.キャラクタの認識にはキャラクタごとの特徴を学習した機械学習が用いられるが,複数の作品についてデータセットを作成する作業には膨大なコストがかかる.したがって,データセットを効率的に構築するために教師なし学習によってキャラクタ画像を分類する技術が必要となる.しかし,キャラクタ顔画像は一般画像よりも類似度の表現が困難であるほか,多数のノイズデータが存在することから従来の画像クラスタリングを適用できない.本論文では,CNNの出力をDBSCANでクラスタリングすることによって類似度の高い画像のみを抽出する手法を提案する.実験結果より,提案手法が複数の主要キャラクタをクラスタとして抽出可能であることを確認した.