- 著者
-
吉田 将人
福原 知宏
増田 英孝
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 研究報告デジタルドキュメント(DD)
- 巻号頁・発行日
- vol.2009, no.35, pp.37-44, 2009-03-18
ブログ記事と Web ページを利用したイベント情報抽出手法を提案する.提案手法は,ブログ記事からイベント名抽出パターンを構築し, Web ページからイベント名を抽出する.本研究では,ブログ記事と Web ページを利用したイベント情報抽出手法を提案する.ブログ記事を用いることにより,記事の書かれた日付が分かり,イベント名抽出パターンとイベント開催日の関係を把握できる.Web ページを用いることにより,イベント名検索の網羅性を広げることができる.提案手法では,まず,いくつかのイベント名に対してブログ記事を収集し,そこからイベント名の前後に連接しやすいパターンを抽出する.次に,抽出したパターンを用いて Web 全体からイベント名を収集する.提案手法のイベント名収集適合率と将来構想について報告する.An extraction method of event names appeared on the Web using blog and Web articles is described. Proposed method extracts event names from Web pages by finding extraction patterns of event names from blog articles. The method finds extraction patterns from blog articles that contain event names given by a user. Because different names for the same event can be appeared on the Web, the method identifies the same event using a string kernel that can measure similarities of event names. Then, the method finds event names by using extracted patterns. Preliminary results of an experiment are described.