著者
川井 拓摩 寺西 俊裕 有木 康雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会ソサイエティ大会講演論文集
巻号頁・発行日
vol.1996, 1996-09-18

ニュース映像をマルチメディア情報資源としてディジタル化し、索引付けして分類する研究を行なっている。この研究では、テロップ中の文字を認識して形態素解析し、二文字以上の名詞をキーワードとして抽出し、このキーワードを索引としてニュース記事に付与するとともに、政治・経済などの10分野に分類している。これまでの報告では、テロップの文字切り出し率は92.2%であったが、文字認識率が53.1%と低く、これが原因となって、索引付与率と記事分類率が78.1%、62.5%と低い結果になっていた。文字認識率が低い理由としては、学習に使っている文字フォントと、テロップとして使われている文字フォントの違い、テロップ中の文字に重畳する雑音があげられる。今回、平滑化フィルタを使ってこの雑音を除去する処理を行ない、文字認識率が向上するとともに、索引付与率、記事分類率が向上したので報告する。
著者
有木 康雄 杉山 善明 石川 則之 寺西 俊裕 櫻井 光康
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.96, no.385, pp.31-38, 1996-11-22
被引用文献数
16

ニュース映像を対象とし, 記事単位に分割した後, 文字・音声・画像情報を基に索引付けして記事を分類する研究を行っている. 1つの記事は, スタジオシーンで始まり, スタジオシーンに終ることを利用し, カット検出されたフレーム集合において, ループを検出して記事を切り出している. 5分間のNHKニュース30日分をデータベースとし, 99.2%の記事切り出し率を得た. また, ニュース映像中のテロップを認識し, 索引付けして記事を政治・経済など10の分野に大分類した. 同じデータベースに対して, 78.1%の索引付与率と62.5%の記事分類率を得た. ニュース音声に対しても, キーワードスポッティングにより, キーワードを抽出して索引付けし, 記事を10の分野に大分類した. キーワード抽出率53.5%に対して, 50.7%の記事分類率を得た. 最後に, 画像中から顔領域を部分空間法により抽出し, 認識・追跡する実験を行い, 高い認識率を得た.