著者
三村 喬生 松村 杏子 松村 優哉 関家 友子
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.70, no.4, pp.181-186, 2020-04-01 (Released:2020-04-01)

テキスト分析とは,文字として符号化された筆者の意図を定量的な手法により逆符号化するプロセスである。特に大量のデータを用い,その内部に潜む構造や背後にあるアルゴリズムを統計的に推定する手法が盛んに研究され,多くのプログラミング言語において実装が進んでいる。その中でもR言語はプログラミング初心者でも見通しよく解析プロセスを進めることができるため入門に適している。そこで本稿ではテキスト分析初心者に向けた,本格的な分析に挑む前に知っておくべき統計的な基礎知識・基本的な分析環境の構築法・小規模データによる解析の具体事例をハンズオン形式でまとめた。