- 著者
-
関口 裕一郎
佐藤 吉秀
川島 晴美
奥田 英範
奥 雅博
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
- 巻号頁・発行日
- vol.2005, no.117, pp.27-32, 2005-11-21
- 被引用文献数
-
2
blog記事は省略を多く含む口語的な記述がなされている為,文中の情報のみによる話題語句の判別は難しい.本論文では,発信者相互の興味の関連性を抽出し,ある語句を使用している発信者集合の持つ関連度の分布を見ることにより,高い関連度を持つ発信者間で使われる語句に高い話題度を算出する.blog記事の集合を用いて実験を行った結果,記事中の話題を表す語句に対して,高い話題度を算出することができた.In this paper, we describe the method to detect the topic words from blog documents. The 'topic words' is defined as a word that gains the attention of people sharing same interest. While blog documents are written by ordinal people, their texts are written in abbreviated informal expression. We use the information of blogger to adjust this characteristic of blog documents. The proposed method extracts the relevancies of each blogger; compares the deviation of these relevancies; and calculates the topic scores for each word of a blog document. The experiment shown that the method can extract appropriate topic words from blog documents.