- 著者
-
土村 成美
Tsuchimura Narumi
ツチムラ ナルミ
- 出版者
- 大阪大学大学院言語文化研究科
- 雑誌
- 言語文化共同研究プロジェクト
- 巻号頁・発行日
- vol.2017, pp.19-29, 2018-05-30
テクストマイニングとデジタルヒューマニティーズ 2017木研究ではイギリスの女性ミステリー作家Agatha Christieの作品の語彙的特徴に関して,他作家の作品との比較を通して分析を行うことを目的とする。比較対象として, Christieと同じくイギリスミステリー黄金時代に活躍した作家であるDorothy SayersとMargery Allinghamの作品を用いる。機械学習の一手法であるRandom Forestsを用い, 3作家の作品の分類を行うと共に,各作家の特徴語を抽出した。長編・短編作品全てを用いた分類を行うと誤分類が発生するものの,分類対象を長編作品に限定すると,正確に分類を行うことが可能であった。固有名詞が分類に大きく寄与した変数として抽出され,固有名詞が分類精度を向上させている可能性も考えられたが,固有名詞を除外して分類を行なっても,正確な分類結果となった。Christieの特徴語としてまずは-ly副詞が多く見られ,-ly副詞を用いてChristie が登場人物の言動の様子を詳述しているのではないかと考えられる。またyesやsure, youのような会話文に特徴的な語が多く抽出された。Christie作品は会話文を中心として物語が進められる作品が多く,そのことを反映した結果となっていると言える。This study investigates characteristic words of works by Agatha Christie, a female mystery writer in the UK, comparing with other authors'ones. The selected authors for the comparison are Dorothy Sayers and Margery Allingham. All of them are famous female mystery writers during Britain's golden age of crime fiction. This study applied Random Forests, a machine learning method, for classifying the three authors'works and extracting characteristic words from each author's works. The accuracy of classification was a little low when short stories were included in the data for the analysis, but when only long novels were used in Random Forests, all the texts were correctly classified into three different groups with an accuracy of 100%. First, the extracted characteristic words from Christie's works are -ly adverbs. Christie might use these words to describe how the characters in her works acted or said something. Second, spoken vocabularies like yes, sure, and you are also extracted as characteristic words of Christie's works. This result should be because Christie's novels contain a lot of conversations between characters.