著者
黄 晨雯 Huang Chenwen
出版者
大阪大学大学院言語文化研究科
雑誌
言語文化共同研究プロジェクト
巻号頁・発行日
no.2020, pp.43-53, 2021-05-31

テキストマイニングとデジタルヒューマニティーズ 2020本稿では、Dimo(2020)によって提起された新たなトピックモデルTop2Vecを使用して、トピックという視点から小説の解読を試みることを主な目的とする。中国の民国時代に活躍した有名な推理作家である程小青の作品を分析対象として、実行結果をもとにトピックの構成単語、またトピックとテキストファイルの関係性などを考察する。程小青の作品全体を最も代表するトピックは社会間題をめぐる話題であり、冒頭部分において大概社会間題に関する思考や論述が導入的な話として好まれることを解明した。これは先行研究の質的分析においても検討されたことであるが、トピックの視点より客観的に裏付けしている。また、トピック間の関係性を可視化して、例えば封鎖空間を中心に事件を展開する形が好かれるなどのスタイル的なことも考察できる。文体的には言築逍いが非常に異質な作品もトピックから見つけ出せる。さらに、他の作家との比較にあたって、Top2Vecの実用性がどれほどあるかを実験を繰り返して試みたところ、事前学習モデルを導人したTop2Vecの方がより汎用的だということも解明した。本文旨在运用Dimo 在2020 年新提出的Top2Vec 主题模型来尝试通过主题这个视角解读小说。主要的研究对象是中国民国时代非常著名的推理小说家程小青的作品。通过考察模型生成的各个主题的构成单词以及主题所对应的文档之间的关系来对小说进行分析。从结果上来看,最能代表程小青的是有关于社会问题的主题。而且通过对小说开头部分主题成分的分析可以看出大部分的作品都喜欢用对社会问题的思考和讨论来作为导入。这些在先行研究中也有被提到,但是通过主题的视角更能客观证明质性分析的结果。另外,通过主题两两关系的可视化图可以看出不少程小青在情节设计上的风格,譬如偏爱以室内空间作为事件场所等。通过对主题词和主题分布的分析也可以区分用词较为独特的部分作品。最后也探讨了运用Top2Vec 进行多个作者间主题分析的可能性。经过多次实验可发现,导入了预训练模型的Top2Vec在这方面颇有实用性。

言及状況

外部データベース (DOI)

Twitter (4 users, 4 posts, 1 favorites)

黄 晨雯 - Top2Vec による小説の探索的研究 : 程小青の作品解読を中心に https://t.co/Wle6xv72be
黄 晨雯 -  Top2Vec による小説の探索的研究 : 程小青の作品解読を中心に https://t.co/HqpdeqFDmp

収集済み URL リスト