本研究では情報検索技術を利用したブロッククローン(コードブロック単位のコードクローン)の検出手法を提案する.既存研究において関数単位でコードクローンを検出する手法を提案したが,この手法は検出粒度が大きいため検出漏れが起きるという問題点があった.この問題を解決するために,本手法では,ソースコード中の識別子や予約語に利用される単語に対して重み付けを行い,コードブロックから変換された特徴ベクトル間の類似度を求め,ブロック単位でクローンの検出を行う.この手法は,クラスタリングの手法や特徴ベクトルのデータ構造の工夫を行うことにより.既存手法と比較して,より小さい粒度でコードクローンを検出することができ,かつ検出時間とメモリ使用量を削減できるという利点がある.また評価実験では,既存のコードクローン検出手法と比較を行い,高速に高い精度で検出を行うことができた.