著者
川井 拓摩 寺西 俊裕 有木 康雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会ソサイエティ大会講演論文集
巻号頁・発行日
vol.1996, 1996-09-18

ニュース映像をマルチメディア情報資源としてディジタル化し、索引付けして分類する研究を行なっている。この研究では、テロップ中の文字を認識して形態素解析し、二文字以上の名詞をキーワードとして抽出し、このキーワードを索引としてニュース記事に付与するとともに、政治・経済などの10分野に分類している。これまでの報告では、テロップの文字切り出し率は92.2%であったが、文字認識率が53.1%と低く、これが原因となって、索引付与率と記事分類率が78.1%、62.5%と低い結果になっていた。文字認識率が低い理由としては、学習に使っている文字フォントと、テロップとして使われている文字フォントの違い、テロップ中の文字に重畳する雑音があげられる。今回、平滑化フィルタを使ってこの雑音を除去する処理を行ない、文字認識率が向上するとともに、索引付与率、記事分類率が向上したので報告する。