- 著者
-
望月 朝香
鈴木 泰博
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告. MPS, 数理モデル化と問題解決研究報告 (ISSN:09196072)
- 巻号頁・発行日
- vol.67, pp.179-182, 2007-12-20
- 参考文献数
- 6
文章を読んだ後に「著者らしい雰囲気のする文章だった」と感じる経験はよくある。この目に見えない「雰囲気」、即ち作者特有の文体印象について、小説のテキストデータを数量化し分析することで考える。文体印象を醸し出す要素は様々考えられるが、本研究では(1)「句読点の分布」(2)「読みでの文字数」(3)「文章表現方法・多頻出言語」の3項目に着目する。句読点の使い方に著者特有の文構造が、読みでの文字数では頭の中のリズム、文章表現方法・多頻出言語から著者の愛用語や単語使用方法の癖が現れ、文体印象の要素となるためである。本論文では作者の特徴の抽出に相当する(1)と(2)について行う。かかる特徴付けを行い文体や作家の雰囲気を数量化することで、雰囲気を用いた文献検索を可能にし、また作者不詳の歴史文献の作者特定へ応用することが可能である。