著者
廖 宸一 廣井 慧 梶 克彦 河口 信夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. UBI, [ユビキタスコンピューティングシステム] (ISSN:09196072)
巻号頁・発行日
vol.2015, no.13, pp.1-7, 2015-05-04

本研究は,店舗のホームページやブログからクーポンやキャンペーンなどのイベント情報を抽出する方法を提案する.この方法を利用してユーザはをひとつひとつの店舗のホームページの閲覧を必要とせず,イベント情報抽出の網羅性と効率性を支援できる.本提案は Web ページブロック分割およびイベント情報認識の二つのタスクから構成される.一つ目のタスクでは Web ページをタイトルや説明文や日付などのイベント情報を含むブロックに分割する.従来の研究は特定なタグ,画面構成あるいはブロックの機能などを特徴量として Web ページを分割することが多く,半構造化データのイベント情報抽出が難しかった.本研究では HTML 構造解析に基づいて Web ページをブロックに分割する.二つ目のタスクとは分割されたブロックから不用な情報を取り除くため,イベント情報を識別する.本研究では機械学習の手法を用いてイベント情報の識別を実現する.名古屋駅地下街 「エスカ」 と 「ユニモール」 にある店舗 96 軒を対象として行った検証実験とその結果を示す.

言及状況

はてなブックマーク (2 users, 2 posts)

Twitter (1 users, 1 posts, 0 favorites)

収集済み URL リスト