- 著者
-
吉田 光男
乾 孝司
山本 幹雄
- 出版者
- 情報処理学会
- 雑誌
- 情報処理学会研究報告. データベース・システム研究会報告 (ISSN:09196072)
- 巻号頁・発行日
- vol.2009-DBS-149, no.20, pp.1-8, 2009-11
近年のブログの普及により,ブログのコンテンツを利用するサービスや研究が盛んになってきている.ブログのコンテンツは,ポストと呼ばれるブログの書き手によるコンテンツと,コメントと呼ばれるブログの読者によるコンテンツに大分する事ができる.ブログのコンテンツを利用する場合は,それらが別々に抽出できている事が望ましい.本論文では,ブログ記事集合を用いる事により,ポストとコメントを自動的に分離抽出する手法を提案する.本手法は,ポストはブログ記事集合全てのブログ記事に出現するが,コメントはいずれかのブログ記事にしか出現しないというアイデアが基になっている.また,本手法のアルゴリズムを実装したソフトウェアを用いて実験を行い,日本語ブログサイトに対しての有効性を示す.