- 著者
-
佐藤 吉秀
川島 晴美
佐々木 努
奥 雅博
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
- 巻号頁・発行日
- vol.105, no.203, pp.1-6, 2005-07-15
- 被引用文献数
-
2
逐次増加するニュース記事中に含まれる話題情報を効率的に把握するため, 新鮮で可能な限り多くの幅広い話題情報を最新話題語と呼ぶキーワードの形態で抽出する手法について報告する.ニュース記事中の話題を扱うにあたり, 世間の注目度が高い出来事を伝える記事数が増加する「話題の広がり」と, 広がり状態が続報記事発行によって時間的に持続する「話題の伸び」の2つの側面に注目する.提案手法では, 話題の整理のために記事をジャンル分類・クラスタリングした後, 記事のタイムスタンプから算出する記事新鮮度, および記事間類似度を用いて各クラスタを代表する最新話題語を抽出する.ニュース記事(2164記事)を対象にした評価実験の結果, 提案手法はクラスタ中の新鮮かつ代表的な話題を表し, さらに受容性も高い語句を抽出可能であることを確認した.