著者
南野 朋之 鈴木 泰裕 藤木 稔明 奥村 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.23, pp.129-136, 2004-03-05
被引用文献数
4

近年注目され始めている情報源としてblog (Weblog)がある.現在,blogというと,blogツールと呼ばれる管理ツールを使用して作成されるWebページを指すことが多いが,日本ではblogツール登場以前から,Web日記という形で個人による情報発信が行われており,非常に有用な情報源となっている.そこで本研究では,このようなWeb日記も含めてblogと呼び,特定のツールやメタデータに依存しない,HTML文書の解析に基づいた手法で,これら個人の発信する時系列に沿って掲載される情報を網羅的に収集,監視するシステムを提案する.We present a system that tries to automatically collect and monitor Japanese blog collections that include not only ones made with blog softwares but also ones written as normal web pages. Our approach is based on extraction of date expressions and analysis of HTML documents. Our system also extracts and mines useful information from the collected blog pages.

言及状況

はてなブックマーク (2 users, 2 posts)

収集済み URL リスト