文章基本信息
- 标题:エッジ空間パターンを利用したテレビ番組映像からの字幕テキスト領域検出
- 本地全文:下载
- 作者:河合 吉彦 ; 望月 貴裕 ; 住吉 英樹 等
- 期刊名称:映像情報メディア学会誌
- 印刷版ISSN:1342-6907
- 电子版ISSN:1881-6908
- 出版年度:2015
- 卷号:69
- 期号:5
- 页码:J197-J206
- DOI:10.3169/itej.69.J197
- 出版社:The Institute of Image Information and Television Engineers
- 摘要:本論文では,エッジ空間パターンを利用したテレビ番組映像からの字幕テキスト領域の検出手法を提案する.エッジ空間パターンは,文字を形成する線や点の配置を反映した特徴量であり,着目画素の周囲におけるエッジの分布パターンに基づいて算出される.エッジの交差や直線以外のエッジも考慮することができ,背景画像の変動にも頑健な特徴量である.提案手法では,番組映像から取得したフレーム画像を走査窓で走査し,窓領域から算出した特徴量を機械学習で判別することによって字幕テキストの候補領域を求める.その後,検出された候補領域をエッジ密度や領域の形状などに基づいて選別し,字幕テキスト領域の外接矩形を検出する.約10時間のテレビ番組映像を対象とした評価実験では,再現率が89.9%,適合率が88.0%,F値が0.889という結果が得られ,従来手法よりもF値が0.135向上することが確認された.
- 关键词:字幕テキスト;字幕スーパー;オープンキャプション;エッジ空間パターン;テレビ番組映像;映像インデキシング