著者
山田 一郎 中田 洋平 松井 淳 松本 隆 三浦 菊佳 住吉 英樹 八木 伸行
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.76, pp.127-132, 2007-07-25
参考文献数
13

テレビ番組のナレーションでは、「場所紹介」や「人物紹介」など特定の事柄を表現するために同じような言い回しが多用される。このような言い回しを含む文章区間が抽出できれば、対応する番組映像区間の場所紹介や人物紹介といったメタデータを付与することができる。本稿では、番組のクローズドキャプションから特定の事柄を表現する文章に類似した文章を抽出するために、文章間の類似性を評価する手法を提案する。提案手法では文章を構文解析した結果、得られる木構造中の部分木を特徴とし、この特徴をサンプリングして学習する GibbsBoost アルゴリズムを用いて文章間の類似性を評価する。紀行番組のクローズドキャプションを対象として、場所を映像とともに説明する定型表現文章区間にある文章との類似性を評価する実験を行い、提案手法の有効性を確認した。In the closed captions, there are a lot of typical expressions to express specific things, for example, first introduction of a guest in a talk show or explanation of a place in travel program. Such information helps us to put metadata to the corresponding scenes. This paper proposes a method to evaluate the similarity between multiple sentences in order to extract a section in which sentences are similar to the typical expressions expressing specific things. The first step generates tree structures from input section of sentences and extracts subtrees from these tree structures. We use Gibbsboost algorithm which samples these subtrees for features and learns the features to evaluate the similarity. In the experiment of judging whether a section of sentences is similar to the section which explains a place with video targeting closed captions of TV programs concerned with travel, we show the effectiveness of our method.
著者
山田一郎 三浦菊佳 住吉英樹 八木伸行 奥村学 徳永健伸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.82, pp.25-30, 2006-07-27
参考文献数
9
被引用文献数
2

テレビ番組のナレーションでは、「場所紹介」や「人物紹介」など特定の事柄を表現するために同じような言い回しが多用される。このような言い回しを含む文章区間が抽出できれば、対応する番組映像区間の場所紹介や人物紹介といったメタデータを付与することができる。そこで本稿では、番組のクローズドキャプションを対象として定型表現を含む文章区間を抽出する手法を提案する。提案手法では、複数文のテキストデータから木構造を生成して、木構造間の類似性を木構造に含まれる部分木の類似度により評価する。この結果を弱学習器としたAdaBoostアルゴリズムにより学習を行い定型表現か否かの判定を行う。紀行番組のクローズドキャプションを対象として、場所を映像とともに説明する定型表現文章区間を抽出する実験を行い、提案手法の有効性を確認した。In the closed captions, there are a lot of typical expressions to express specific things, for example, first introduction of a guest in a talk show or explanation of a place in travel program. Such information helps us to put matadata to the corresponding scenes. This paper proposes a method to extract a section including typical expressions. The first step generates tree structures from inputted section of sentences and evalutes the similarities between those tree structures. We use these similarities as weak larners of adaboost algorism to judge whether the section of sentences includes typical expressions or not. In the experiment of detecting sections including typical expressions which explain a place with video targeting closed capitions of TV programs conserned with travel, we show the effectiveness of our method.
著者
三浦 菊佳 住吉 英樹 山田 一郎 宮﨑 太郎 宮崎 勝 松井 淳 加藤 直人 田中 英輝
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会誌
巻号頁・発行日
vol.72, no.3, pp.J66-J72, 2018

<p>AI(人工知能)技術でより多くの情報を活用して,質の高い番組を制作する取り組みが始まっている.過去に放送された番組を,新たな番組制作により活かすために,放送日時やジャンルといった表層的な情報に加え,詳細なコンテンツ内容で番組を関連付けたテレビ番組マップを提案する.番組検索の際,目的の番組と同時に,意味的に関連する別の番組も見つけることができるほか,一般視聴者向けネットサービスにおけるお薦めコンテンツ提示などにも応用できる.本論文では,テレビ番組マップを自動構築する手法について述べる.大規模なWebデータから獲得した単語間の意味的関係を用い,EPG(電子番組表)に含まれる番組概要文から主題を表す単語を取り出し,抽出した主題語と番組との関係を推定する.実際にNHKの科学番組に手法を適用し,テレビ番組マップを試作した実験について報告する.</p>
著者
三浦 菊佳 山田 一郎 小早川 健 松井 淳 後藤 淳 住吉 英樹 柴田 正啓
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.108, no.408, pp.53-58, 2009-01-19

大量に蓄積されている放送番組から目的の映像を検索する際、細かいシーン単位で取り出せればより有効に映像を二次活用することができる。本稿では、レギュラー番組におけるクローズドキャプションから、あるコーナーを特徴づけたり、場面転換を表したりする繰り返し出現する表現(反復句)を教師なしで自動獲得することで、番組を分割する手がかり語を捉える。生物の進化をモデルに、番組中に毎回偏って繰り返し出現する語に着目し、Fisherの正確確率検定を利用したセグメントアラインメント、スクリーニングを行い反復句を抽出する手法を提案する。情報番組を対象とした実験を行った結果を評価し、提案手法の有効性を確認した。