著者
黄 晨雯 コウ シンブン
出版者
大阪大学大学院言語文化研究科
雑誌
言語文化共同研究プロジェクト
巻号頁・発行日
no.2019, pp.31-45, 2020-07-31

テキストマイニングとデジタルヒューマニティーズ本稿では、中国20世紀以降の著名なミステリー作家である程小青と鬼馬星の作品計34点に対して量的分析を行うことを目的とする。主に代名詞と名詞の情報に焦点を当て、言語差異を見つけ出す試みをする。まずは主成分分析を実行し、テクスト間の相互関係、また単語間の相互関係を示す散布図を観察することによって、両作家の作品における明確な差異を解明した。特に女性を指す三人称代名詞の使用について大差が見られる。時代の影響により言葉遣いも変化するものである。さらに、LDAモデルを実行し生成された50個の名詞トピックに対して考察を行う。中国20世紀以降のミステリー小説において、身体言語と室内に関わるトピックは非常に大きな割合を占めている。程小青を特徴づける身体言語のトピックから、作品における人物の特徴まで探ることができた。寝室の痕跡と解釈したトピックも程小青を代表しているが、複数のトピック内容が1つのトピックに混在していることからトピック数の調整による細分化も必要なのではないかという示唆も受けた。本文旨在通过计量手法对中国近代著名的推理小说家程小青和鬼马星的作品共34本小说进行定量分析。本文主要聚焦在作品中的代名词和名词上,通过主成分分析手法,可以看出在代名词和名词的使用率上,两位作家的作品之间有着明显的区别。尤其是在对于女性第三人称的用法的不同上可以总结为时代变化对千用词的影响。本文还应用了主题模型分析,设定了50 个名词主题。从结果上看,在悬疑小说中,人物肢体语言以及有关房间构造的主题占了非常大的比例,可以说是悬疑小说的代表性主题。在有关肢体语言的多个主题中,通过主题的分布可以看出程小青的相关主题带有非常强烈的作品特色,可以通过主题中的词语分布归结出场景和人物的特点。有笑寝室痕迩的主題也是程小青作品的特色,但是i亥主題中混朱着多↑主題的笑鍵詞,有必要増加主題数来込到釧分主題的目的。