著者
國廣直樹 長谷川智史 穴田一
雑誌
第73回全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.379-380, 2011-03-02

文章の書き方には人それぞれ特徴がある.一番特徴が表れるのは文字の筆跡であるが,電子テキストの普及等から,筆跡以外の特徴を用いて解析を行い,著者不明の作品や文献等の書き手を識別する研究が行われている.<br />既存の研究では,読点直前の品詞や単語の出現頻度等に著者の特徴が表れると考え,主成分分析や類似度等を用いて比較することで著者の識別が行われてきた.しかし,比較文章における文字数の統一や,短い文章を使用できないという制約があるものが多い上,未だに著者の特徴がどこに表れるか明確になっていない.そこで,本研究では,文章の文字数に依存しない著者の特徴を抽出する方法を提案し,その有効性を検討する.