- 著者
-
堀 修
三田 雄志
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.84, no.8, pp.1800-1808, 2001-08-01
- 被引用文献数
-
24
本論文では,映像中に現れるテロップの文字部をOCRで判読できるように,精度良く切り出す方法を提案する.従来の研究では,映像中のテロップを背景から切り出す方法としてテロップの輝度が背景に比べて高いことを利用し,しきい値を決めて2値化する方法がとられていた.しきい値の決め方として,背景と文字の二つの輝度の分布を仮定した大津の方法や大津の方法を局所ブロックに用いた塩の方法がある.しかし,映像のように背景に様々な輝度を含むものでは,必ずしも仮定が成り立たず,良いしきい値が得られないという問題があった.また,実際には,影付け,縁取り及び信号変換処理の影響で文字の周辺で必ずしも輝度が高くなく,OCRで判読可能な十分な精度で文字を切り出すことができなかった.そこで,文字部の輝度分布をロバストに推定し,文字部として信頼度の高い領域を最初に抽出し,推定された分布に基づいて領域拡張を行い,文字部のみを切り出す方法を提案する.実,験の結果,従来手法より精度良く文字部を検出できOCR判読率が向上することを示す.