著者
丸山 正人 竹川 高志
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.4Rin150, 2020 (Released:2020-06-19)

個人の考える小説の類似度は多様であり,著者を基準として類似していると考える人や,テーマを基準として類似していると考える人などが存在する.また,小説を探す際にはタイトルやあらすじ等の情報をもとに読むかどうかの意思決定を行うが,それらの情報からその小説に期待する体験を得られるかの推測が難しいため,推薦システムによる補助が重要となる.そこで本研究では,個人が好んだ小説の本文を学習することによって,個人毎に異なる小説の類似度の推定を目指す.Word2vecで学習された単語のベクトルが1つの小説に登場する単語同士で纏まって分布することを用い,小説毎に登場する単語のベクトルの群間分散を用いて小説の類似度を求める.また,異なる基準で集められた小説を学習したWord2vecモデルがそれぞれ異なった類似度を持っているか調査した.結果,学習に用いられた小説の基準に該当するような小説とそこから外れるような小説の類似度が小さくなることを確認した.
著者
丸山 正人 竹川 高志
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3Rin233, 2019 (Released:2019-06-01)

Word2vecは単語の概念を表したベクトル表現を学習する手法である.これを用いて文章内に誤った意味で用いられている単語の検出を目指す.本研究では文章内にある固有名詞を文章で用いられていない固有名詞に交換を行い,その固有名詞を誤字として検出法の検討を行った.結果,線形判別分析を用いると文章内の固有名詞と文章に含まれていない固有名詞の分布の分離を進められ誤字の検出率の向上が見込まれた.